2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
नमस्कार, सर्वेभ्यः, अहं मुजुओ अस्मि!
प्राकृतिकभाषाप्रक्रियाकरणम् (NLP) कृत्रिमबुद्धेः क्षेत्रस्य महत्त्वपूर्णा शाखा अस्ति यत् सङ्गणकानां कृते मानवभाषां अवगन्तुं, विश्लेषणं कर्तुं, जनयितुं च सक्षमं कर्तुं प्रतिबद्धा अस्ति । बृहत् आँकडानां विकासेन गहनशिक्षणेन च एनएलपी इत्यस्य उपयोगः विविधक्षेत्रेषु, यथा यन्त्रानुवादः, भावविश्लेषणं, पाठसारांशः इत्यादिषु व्यापकरूपेण कृतः अस्ति । अस्मिन् लेखे प्राकृतिकभाषासंसाधनार्थं पायथन् इत्यस्य उपयोगः कथं करणीयः इति परिचयः भविष्यति, यत्र सामान्यतया प्रयुक्ताः पुस्तकालयाः साधनानि च सन्ति, तथैव केचन व्यावहारिकप्रकरणाः अपि सन्ति ।
पायथन् एकं समृद्धं एनएलपी पुस्तकालयं प्रदाति यत् विभिन्नानि एनएलपी कार्याणि शीघ्रं कार्यान्वितुं साहाय्यं कर्तुं शक्नोति । अत्र केचन सामान्यतया प्रयुक्ताः एनएलपी पुस्तकालयाः सन्ति :
NLTK (Natural Language Toolkit) इति मानवभाषादत्तांशस्य संसाधनार्थं मुक्तस्रोतस्य पायथन् पुस्तकालयः अस्ति । एतत् शब्दविभाजनं, वाक्भागस्य टैगिंग्, नामकृतसत्तापरिचयः इत्यादीनि अनेकानि कार्याणि प्रदाति । NLTK संस्थापनस्य आदेशः निम्नलिखितरूपेण अस्ति ।
!pip install nltk
spaCy मानवभाषायाः संसाधनाय अवगमनाय च एकः शक्तिशाली पायथन् पुस्तकालयः अस्ति । एतत् अनेककार्यं प्रदाति, यथा शब्दविभाजनं, वाक्भागस्य टैगिंग्, निर्भरतानिराकरणम् इत्यादयः । spaCy संस्थापयितुं आदेशः निम्नलिखितरूपेण अस्ति ।
!pip install spacy
गेन्सिमः पाठदत्तांशसंसाधनार्थं पायथन् पुस्तकालयः अस्ति, यस्य उपयोगः मुख्यतया अनिरीक्षितशिक्षण-एल्गोरिदम्-इत्यस्य कृते उपयुज्यते, यथा विषय-प्रतिरूपं, दस्तावेज-सादृश्यम् इत्यादीनां कृते ।Gensim इत्यस्य संस्थापनस्य आदेशः यथा अस्ति