Pythonで日本語をローマ字に変換するプログラム(ひらがなカタカナ漢字)

こんにちは、minoruです。

今回は、Ubuntu上のPython3で日本語の全角文字をローマ字に変換する方法をご紹介します。

まず、Ctrl + Alt + Tでターミナルを開き、以下のコマンドを入力してpykakasiというライブラリをインストールしてください。

pip install pykakasi

次に、以下のPythonコードを使って、漢字をローマ字に変換します。

import pykakasi

kanjis = ['国立 東京 大学', '薔薇 薔薇 薔薇 薔薇 薔薇']

kks = pykakasi.kakasi()

for kanji in kanjis:
    words = kanji.split(' ')  # スペースで区切って単語ごとに変換
    result = []
    for word in words:
        result.append(kks.convert(word)[0]['hepburn'])  # ローマ字変換
    print(' '.join(result))

参考:
https://office54.net/python/module/pykakasi-kanji-convert


注意点:

日本語の文章は、スペースで区切らないと正確に変換されないことがあります。そのため、文章の適切な場所でスペースを入れると、より正確な変換ができます。この点に注意してご利用ください。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする