ホーム > コンピュータ・知財 > その他temp >  

不要な改行コードの削除法

OCRで読んだテキストやコピー&ペーストしたテキストに不要な改行コードが入っていることがある。

例えば、以下のような文章の場合である。
なお、改行コードを「↓」で表示する。

ーーーーー
 ○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○↓
○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○↓
○○○○○○○○○○○○○○○○○○○○○。↓
 ○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○↓
○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○○↓
○○○○○○○○○○○○○○○○○○○○○○○○○○○○○。↓
ーーーーー

手を加える場合などに、1、2、4、5行目の改行コードは邪魔である。

一括置換で改行コードを削除すると、本来必要な3,6行目の改行コードまで削除することになってしまう。

このような場合、私は、まず、「↓」→「↓↓」という置換をし、次いで、「。↓↓」→「。↓↓↓」という置換をし、最後に、「↓↓」→「」という置換をすることにより、目的を達している。

ただ、行末に「。」がないタイトル行は、この方法ではうまくいかない。

みんなは、どうしているのだろうか?

タイトル
お名前
email
ご感想
ご確認 上記内容で送信する(要チェック


 


   ホーム > コンピュータ・知財 > その他temp > 不要な改行コードの削除法