こんにちは、minoruです。
今回は、Ubuntu上のPython3で日本語の全角文字をローマ字に変換する方法をご紹介します。
まず、Ctrl + Alt + Tでターミナルを開き、以下のコマンドを入力してpykakasi
というライブラリをインストールしてください。
pip install pykakasi
次に、以下のPythonコードを使って、漢字をローマ字に変換します。
import pykakasi
kanjis = ['国立 東京 大学', '薔薇 薔薇 薔薇 薔薇 薔薇']
kks = pykakasi.kakasi()
for kanji in kanjis:
words = kanji.split(' ') # スペースで区切って単語ごとに変換
result = []
for word in words:
result.append(kks.convert(word)[0]['hepburn']) # ローマ字変換
print(' '.join(result))
参考:
https://office54.net/python/module/pykakasi-kanji-convert
注意点:
日本語の文章は、スペースで区切らないと正確に変換されないことがあります。そのため、文章の適切な場所でスペースを入れると、より正確な変換ができます。この点に注意してご利用ください。