Κοινή χρήση τεχνολογίας

Η Python διαβάζει αρχεία word και σχεδιάζει διαγράμματα cloud λέξεων

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. Εγκαταστήστε τις απαραίτητες βιβλιοθήκες

pip install python-docx wordcloud matplotlib
  • 1

2. Πλήρης κωδικός

import docx
from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 读取Word文件内容
def read_word_file(file_path):
    doc = docx.Document(file_path)
    full_text = []
    for para in doc.paragraphs:
        full_text.append(para.text)
    return 'n'.join(full_text)

# 生成词云图
def generate_wordcloud(text):
    wordcloud = WordCloud(width=800, height=400, background_color='white').generate(text)
    
    # 显示词云图
    plt.figure(figsize=(10, 5))
    plt.imshow(wordcloud, interpolation='bilinear')
    plt.axis('off')
    plt.show()

# 主函数
def main():
    file_path = 'your_word_file.docx'  # 替换为你的Word文件路径
    text = read_word_file(file_path)
    generate_wordcloud(text)

if __name__ == "__main__":
    main()

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31

3. Τροποποίηση σφαλμάτων κινεζικών αλλοιώσεων

Ειδοποίηση:
Εάν υπάρχουν μπερδεμένοι κινεζικοί χαρακτήρες, μπορείτε να τους τροποποιήσετε με τους εξής τρόπους:
Εισαγάγετε την περιγραφή της εικόνας εδώ
Προσθήκη γραμματοσειράς

wordcloud = WordCloud(width=800, height=400, background_color='white', font_path='simhei.ttf').generate(text)
  • 1

Εισαγάγετε την περιγραφή της εικόνας εδώ

Το αποτέλεσμα μετά την τροποποίηση:
Εισαγάγετε την περιγραφή της εικόνας εδώ

4. Λεπτομερής εξήγηση

Λεπτομερής εξήγηση

Βιβλιοθήκη εγκατάστασης:

  • python-docx: χρησιμοποιείται για την ανάγνωση αρχείων Word.
  • wordcloud: χρησιμοποιείται για τη δημιουργία διαγραμμάτων cloud λέξεων.
  • matplotlib: χρησιμοποιείται για την εμφάνιση γραφημάτων cloud λέξεων.

Διαβάστε το περιεχόμενο του αρχείου Word:

  • Χρησιμοποιήστε την κλάση Document του python-docx για να διαβάσετε αρχεία του Word.
  • Επαναλάβετε τις παραγράφους του εγγράφου, προσθέτοντας το κείμενο κάθε παραγράφου σε μια λίστα.
  • Συνδυάστε το κείμενο όλων των παραγράφων σε μια ενιαία συμβολοσειρά.

Δημιουργία διαγράμματος σύννεφων λέξεων:

  • Χρησιμοποιήστε την κλάση WordCloud του wordcloud για να δημιουργήσετε ένα γράφημα σύννεφο λέξεων.
  • Ορίστε το πλάτος, το ύψος και το χρώμα φόντου της λέξης σύννεφο.
  • Καλέστε τη μέθοδο δημιουργίας για να δημιουργήσετε ένα γράφημα σύννεφο λέξεων.
  • Χρησιμοποιήστε το matplotlib για να εμφανίσετε γραφικά σύννεφο λέξεων.

Προφυλάξεις

  • Βεβαιωθείτε ότι η διαδρομή του αρχείου Word είναι σωστή.
  • Μπορείτε να προσαρμόσετε τις παραμέτρους του διαγράμματος σύννεφων λέξεων όπως απαιτείται, όπως χρώμα, γραμματοσειρά κ.λπ.
  • Εάν υπάρχουν πολλές κοινές λέξεις ή λέξεις τερματισμού στο κείμενό σας, μπορείτε να τις εξαιρέσετε χρησιμοποιώντας την παράμετρο stopwords του WordCloud.

Μέσα από τα παραπάνω βήματα, μπορείτε εύκολα να διαβάσετε αρχεία του Word και να δημιουργήσετε όμορφα διαγράμματα cloud λέξεων.