기술나눔

Python은 단어 파일을 읽고 단어 클라우드 다이어그램을 그립니다.

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. 필요한 라이브러리 설치

pip install python-docx wordcloud matplotlib
  • 1

2. 완전한 코드

import docx
from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 读取Word文件内容
def read_word_file(file_path):
    doc = docx.Document(file_path)
    full_text = []
    for para in doc.paragraphs:
        full_text.append(para.text)
    return 'n'.join(full_text)

# 生成词云图
def generate_wordcloud(text):
    wordcloud = WordCloud(width=800, height=400, background_color='white').generate(text)
    
    # 显示词云图
    plt.figure(figsize=(10, 5))
    plt.imshow(wordcloud, interpolation='bilinear')
    plt.axis('off')
    plt.show()

# 主函数
def main():
    file_path = 'your_word_file.docx'  # 替换为你的Word文件路径
    text = read_word_file(file_path)
    generate_wordcloud(text)

if __name__ == "__main__":
    main()

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31

3. 중국어 왜곡 오류 수정

알아채다:
한자가 깨져 있는 경우 다음과 같은 방법으로 수정할 수 있습니다.
여기에 이미지 설명을 삽입하세요.
글꼴 추가

wordcloud = WordCloud(width=800, height=400, background_color='white', font_path='simhei.ttf').generate(text)
  • 1

여기에 이미지 설명을 삽입하세요.

수정 후 효과:
여기에 이미지 설명을 삽입하세요.

4. 자세한 설명

상해

설치 라이브러리:

  • python-docx: Word 파일을 읽는 데 사용됩니다.
  • wordcloud: 단어 구름 다이어그램을 생성하는 데 사용됩니다.
  • matplotlib: 단어 클라우드 차트를 표시하는 데 사용됩니다.

Word 파일의 내용을 읽으십시오.

  • Word 파일을 읽으려면 python-docx의 Document 클래스를 사용하십시오.
  • 문서의 단락을 반복하여 각 단락의 텍스트를 목록에 추가합니다.
  • 모든 단락의 텍스트를 단일 문자열로 결합합니다.

단어 클라우드 다이어그램 생성:

  • 단어 구름 그래프를 생성하려면 wordcloud의 WordCloud 클래스를 사용하세요.
  • 워드클라우드의 너비, 높이, 배경색을 설정합니다.
  • 단어 구름 그래프를 생성하려면 generate 메서드를 호출하세요.
  • matplotlib를 사용하여 단어 클라우드 플롯을 표시합니다.

지침

  • Word 파일 경로가 올바른지 확인하세요.
  • 필요에 따라 색상, 글꼴 등과 같은 단어 클라우드 다이어그램의 매개변수를 조정할 수 있습니다.
  • 텍스트에 일반적인 단어나 불용어가 많은 경우 WordCloud의 불용어 매개변수를 사용하여 제외할 수 있습니다.

위의 단계를 통해 Word 파일을 쉽게 읽고 아름다운 단어 클라우드 다이어그램을 생성할 수 있습니다.