प्रौद्योगिकी साझेदारी

[Elasticsearch] Elasticsearch inverted index इत्यस्य विस्तृतव्याख्या

2024-07-08

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

📑引言

Elasticsearch इति Lucene इत्यस्य आधारेण वितरितं अन्वेषणयन्त्रम् अस्ति, यस्य व्यापकरूपेण उपयोगः पूर्णपाठसन्धानं, लॉगविश्लेषणं, वास्तविकसमयदत्तांशविश्लेषणम् इत्यादिषु क्षेत्रेषु भवति अस्य मूललाभः अस्य शक्तिशालिनः अन्वेषणप्रदर्शने अस्ति, अस्य कार्यप्रदर्शनस्य एकः आधारः विपर्यस्तसूचकाङ्कः अस्ति । अयं लेखः Elasticsearch इत्यस्मिन् उल्टे अनुक्रमणिकायाः ​​विस्तरेण परिचयं करिष्यति यत् पाठकान् तस्य सिद्धान्तान्, संरचनां, अनुप्रयोगं च गभीरं अवगन्तुं साहाय्यं करिष्यति ।

image.png

1. उल्टा सूचकाङ्कस्य परिचयः

उल्टा अनुक्रमणिका पूर्णपाठसन्धानयन्त्रस्य मूलदत्तांशसंरचना अस्ति । इयं संरचना पारम्परिकस्य अग्रे अनुक्रमणिकायाः ​​(अर्थात् दस्तावेजानां कीवर्ड-शब्दानां प्रति नक्शाङ्कनम्) विपरीतम् अस्ति, अतः एतत् उल्टा अनुक्रमणिका इति कथ्यते ।
उल्टे अनुक्रमणिकायां प्रत्येकं कीवर्डं कीवर्डयुक्तानां दस्तावेजानां सूचीयाः सह सम्बद्धं भवति, यत् अन्वेषणक्रियाः विशिष्टकीवर्डयुक्तानि दस्तावेजानि शीघ्रं ज्ञातुं शक्नुवन्ति, तस्मात् प्रश्नदक्षतायां महतीं सुधारं भवति

2. उल्टा सूचकाङ्कस्य मूलभूतसंरचना

विपर्यस्तसूचकाङ्कस्य मूलसंरचनायां निम्नलिखितभागाः सन्ति ।

  1. शब्दकोश: दस्तावेजसमूहे दृश्यमानाः सर्वे कीवर्ड्स सन्ति ।
  2. उल्टा सूची: प्रत्येकस्य कीवर्डस्य कृते, दस्तावेजे कीवर्डः तस्य स्थानस्य च सूचनां समाविष्टं document ID सूचीं अभिलेखयन्तु ।

सरलं उदाहरणं ददातु : १.
अस्माकं समीपे निम्नलिखितत्रयदस्तावेजाः सन्ति इति वदामः ।

  • दस्तावेजम् १ : १."Elasticsearch is a powerful search engine"
  • दस्तावेजः २ : १."Elasticsearch uses inverted index"
  • दस्तावेजम् ३ : १."Search engines use indexes"

विपर्यस्तसूचकाङ्कस्य निर्माणार्थं पदानि निम्नलिखितरूपेण सन्ति ।

  1. टोकनीकरणम् : दस्तावेजं शब्देषु विभज्य मानकीकरणं कुर्वन्तु (यथा लघुवर्णेषु परिवर्तनं, स्टॉपशब्दान् निष्कासयितुं इत्यादयः) ।
  2. शब्दकोशस्य निर्माणं कुर्वन्तु : सर्वेभ्यः दस्तावेजेभ्यः अद्वितीयशब्दान् निष्कासयन्तु।
  3. उल्टासूचीं रचयन्तु: प्रत्येकस्मिन् दस्तावेजे प्रत्येकं शब्दं कुत्र दृश्यते इति अभिलेखयन्तु।

परिणामः यथा भवति ।