Condivisione della tecnologia

Python legge file di parole e disegna diagrammi di nuvole di parole

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. Installare le librerie necessarie

pip install python-docx wordcloud matplotlib
  • 1

2. Codice completo

import docx
from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 读取Word文件内容
def read_word_file(file_path):
    doc = docx.Document(file_path)
    full_text = []
    for para in doc.paragraphs:
        full_text.append(para.text)
    return 'n'.join(full_text)

# 生成词云图
def generate_wordcloud(text):
    wordcloud = WordCloud(width=800, height=400, background_color='white').generate(text)
    
    # 显示词云图
    plt.figure(figsize=(10, 5))
    plt.imshow(wordcloud, interpolation='bilinear')
    plt.axis('off')
    plt.show()

# 主函数
def main():
    file_path = 'your_word_file.docx'  # 替换为你的Word文件路径
    text = read_word_file(file_path)
    generate_wordcloud(text)

if __name__ == "__main__":
    main()

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31

3. Modifica gli errori confusi in cinese

Avviso:
Se sono presenti caratteri cinesi confusi, puoi modificarli nei seguenti modi:
Inserisci qui la descrizione dell'immagine
Aggiungi carattere

wordcloud = WordCloud(width=800, height=400, background_color='white', font_path='simhei.ttf').generate(text)
  • 1

Inserisci qui la descrizione dell'immagine

L'effetto dopo la modifica:
Inserisci qui la descrizione dell'immagine

4. Spiegazione dettagliata

Spiegazione dettagliata

Libreria di installazione:

  • python-docx: utilizzato per leggere file Word.
  • wordcloud: utilizzato per generare diagrammi di word cloud.
  • matplotlib: utilizzato per visualizzare i grafici delle nuvole di parole.

Leggi il contenuto del file Word:

  • Utilizza la classe Document di python-docx per leggere i file Word.
  • Scorri i paragrafi del documento, aggiungendo il testo di ciascun paragrafo a un elenco.
  • Combina il testo di tutti i paragrafi in un'unica stringa.

Genera il diagramma della nuvola di parole:

  • Utilizza la classe WordCloud di wordcloud per generare un grafico di word cloud.
  • Imposta la larghezza, l'altezza e il colore di sfondo della nuvola di parole.
  • Chiama il metodo generate per generare un grafico word cloud.
  • Utilizza matplotlib per visualizzare i grafici delle nuvole di parole.

Precauzioni

  • Assicurati che il percorso del file Word sia corretto.
  • Puoi regolare i parametri del diagramma della nuvola di parole secondo necessità, come colore, carattere, ecc.
  • Se nel tuo testo sono presenti molte parole comuni o stopword, puoi escluderle utilizzando il parametro stopwords di WordCloud.

Attraverso i passaggi precedenti, puoi leggere facilmente file Word e generare bellissimi diagrammi di word cloud.