ホーム > コンピュータ・知財 > その他temp > |
OCRで読んだテキストやコピー&ペーストしたテキストに不要な改行コードが入っていることがある。 例えば、以下のような文章の場合である。 なお、改行コードを「↓」で表示する。 ーーーーー ○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○↓ ○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○↓ ○○○○○○○○○○○○○○○○○○○○○。↓ ○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○↓ ○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○↓ ○○○○○○○○○○○○○○○○○○○○○○○○○○○○○。↓ ーーーーー 手を加える場合などに、1、2、4、5行目の改行コードは邪魔である。 一括置換で改行コードを削除すると、本来必要な3,6行目の改行コードまで削除することになってしまう。 このような場合、私は、まず、「↓」→「↓↓」という置換をし、次いで、「。↓↓」→「。↓↓↓」という置換をし、最後に、「↓↓」→「」という置換をすることにより、目的を達している。 ただ、行末に「。」がないタイトル行は、この方法ではうまくいかない。 みんなは、どうしているのだろうか? |
ホーム > コンピュータ・知財 > その他temp > 不要な改行コードの削除法 |