技術共有

Python はワード ファイルを読み取り、ワード クラウド図を描画します

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. 必要なライブラリをインストールする

pip install python-docx wordcloud matplotlib
  • 1

2. 完全なコード

import docx
from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 读取Word文件内容
def read_word_file(file_path):
    doc = docx.Document(file_path)
    full_text = []
    for para in doc.paragraphs:
        full_text.append(para.text)
    return 'n'.join(full_text)

# 生成词云图
def generate_wordcloud(text):
    wordcloud = WordCloud(width=800, height=400, background_color='white').generate(text)
    
    # 显示词云图
    plt.figure(figsize=(10, 5))
    plt.imshow(wordcloud, interpolation='bilinear')
    plt.axis('off')
    plt.show()

# 主函数
def main():
    file_path = 'your_word_file.docx'  # 替换为你的Word文件路径
    text = read_word_file(file_path)
    generate_wordcloud(text)

if __name__ == "__main__":
    main()

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31

3.中国語の文字化けエラーを修正する

知らせ:
中国語の文字化けがある場合は、次の方法で修正できます。
ここに画像の説明を挿入します
フォントの追加

wordcloud = WordCloud(width=800, height=400, background_color='white', font_path='simhei.ttf').generate(text)
  • 1

ここに画像の説明を挿入します

変更後の効果:
ここに画像の説明を挿入します

4. 詳しい説明

詳しい説明

インストールライブラリ:

  • python-docx: Word ファイルの読み取りに使用されます。
  • wordcloud: ワードクラウド図の生成に使用されます。
  • matplotlib: ワード クラウド チャートを表示するために使用されます。

Word ファイルの内容を読み取ります。

  • Word ファイルを読み取るには、python-docx の Document クラスを使用します。
  • ドキュメント内の段落を繰り返し、各段落のテキストをリストに追加します。
  • すべての段落のテキストを 1 つの文字列に結合します。

ワードクラウド図を生成します。

  • wordcloud の WordCloud クラスを使用して、ワード クラウド グラフを生成します。
  • ワードクラウドの幅、高さ、背景色を設定します。
  • Generate メソッドを呼び出してワード クラウド グラフを生成します。
  • matplotlib を使用してワード クラウド プロットを表示します。

予防

  • Word ファイルのパスが正しいことを確認してください。
  • 必要に応じて、色、フォントなどのワード クラウド図のパラメータを調整できます。
  • テキスト内に一般的な単語やストップワードが多数ある場合は、WordCloud のストップワード パラメーターを使用してそれらを除外できます。

上記の手順により、Word ファイルを簡単に読み込んで、美しいワード クラウド図を生成することができます。