2018年4月18日水曜日

【Mac】濁点が2文字になるテキストを綺麗にするAutomatorワークフロー

Macで例えばPDFのテキストをコピーして使おうとすると、濁点や半濁点が二文字になることがあります。「ば」が「は゛」になる等で、これは「UTF-8-MAC」という文字コードだそうです。これを1文字ずつ修正するのは面倒なので、Automatorで自動的に修正して「UTF-8」に変換するワークフローを作りました。
ワークフローの順序は次の通り。
  1.  UTF-8-MACのテキストを入力
    • Automatorアクション「テキストの入力を求める」
  2. 半角スペースを削除
    PDFの場合は文字の折り返しが半角スペースになるため、それを削除するステップを入れています。
    • Automatorアクション「シェルスクリプトを実行」で「sed -e 's/ //g'」を設定
  3. 文字コードをUTF-8に変換
    • Automatorアクション「シェルスクリプトを実行」で「iconv -f UTF-8-MAC -t UTF-8」を設定
  4. クリップボードにコピー
    • Automatorアクション「クリップボードにコピー」
  5. 通知を表示
    機能的には不要なステップですが、おまけで入れています。
    •  Automatorアクション「通知を表示」でタイトルに「問題なく変換できました」、メッセージに「テキストはクリップボードに保存されています」を設定。タイトル、メッセージは任意で分かりやすいものを入れてください。
作ったワークフロー


参考サイト

0 件のコメント:

コメントを投稿