प्रौद्योगिकी साझेदारी

पायथन् इत्यनेन सह प्राकृतिकभाषाप्रक्रियाकरणम्

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

नमस्कार, सर्वेभ्यः, अहं मुजुओ अस्मि!
प्राकृतिकभाषाप्रक्रियाकरणम् (NLP) कृत्रिमबुद्धेः क्षेत्रस्य महत्त्वपूर्णा शाखा अस्ति यत् सङ्गणकानां कृते मानवभाषां अवगन्तुं, विश्लेषणं कर्तुं, जनयितुं च सक्षमं कर्तुं प्रतिबद्धा अस्ति । बृहत् आँकडानां विकासेन गहनशिक्षणेन च एनएलपी इत्यस्य उपयोगः विविधक्षेत्रेषु, यथा यन्त्रानुवादः, भावविश्लेषणं, पाठसारांशः इत्यादिषु व्यापकरूपेण कृतः अस्ति । अस्मिन् लेखे प्राकृतिकभाषासंसाधनार्थं पायथन् इत्यस्य उपयोगः कथं करणीयः इति परिचयः भविष्यति, यत्र सामान्यतया प्रयुक्ताः पुस्तकालयाः साधनानि च सन्ति, तथैव केचन व्यावहारिकप्रकरणाः अपि सन्ति ।

पायथन् मध्ये एनएलपी पुस्तकालयः

पायथन् एकं समृद्धं एनएलपी पुस्तकालयं प्रदाति यत् विभिन्नानि एनएलपी कार्याणि शीघ्रं कार्यान्वितुं साहाय्यं कर्तुं शक्नोति । अत्र केचन सामान्यतया प्रयुक्ताः एनएलपी पुस्तकालयाः सन्ति :

एनएलटीके

NLTK (Natural Language Toolkit) इति मानवभाषादत्तांशस्य संसाधनार्थं मुक्तस्रोतस्य पायथन् पुस्तकालयः अस्ति । एतत् शब्दविभाजनं, वाक्भागस्य टैगिंग्, नामकृतसत्तापरिचयः इत्यादीनि अनेकानि कार्याणि प्रदाति । NLTK संस्थापनस्य आदेशः निम्नलिखितरूपेण अस्ति ।

!pip install nltk
  • 1
spaCy

spaCy मानवभाषायाः संसाधनाय अवगमनाय च एकः शक्तिशाली पायथन् पुस्तकालयः अस्ति । एतत् अनेककार्यं प्रदाति, यथा शब्दविभाजनं, वाक्भागस्य टैगिंग्, निर्भरतानिराकरणम् इत्यादयः । spaCy संस्थापयितुं आदेशः निम्नलिखितरूपेण अस्ति ।

!pip install spacy
  • 1
गेन्सिम

गेन्सिमः पाठदत्तांशसंसाधनार्थं पायथन् पुस्तकालयः अस्ति, यस्य उपयोगः मुख्यतया अनिरीक्षितशिक्षण-एल्गोरिदम्-इत्यस्य कृते उपयुज्यते, यथा विषय-प्रतिरूपं, दस्तावेज-सादृश्यम् इत्यादीनां कृते ।Gensim इत्यस्य संस्थापनस्य आदेशः यथा अस्ति