बृहत् मॉडल [Qwen2-7B स्थानीय परिनियोजन (WEB संस्करण)] (windows)
2024-07-12
한어 Русский язык English Français Indonesian Sanskrit 日本語 Deutsch Português Ελληνικά español Italiano Suomalainen Latina
बृहत् मॉडल श्रृङ्खला लेख निर्देशिका
Qwen2-7B स्थानीयनियोजनम् (WEB संस्करणम्)
प्रस्तावना
बृहत् मॉडलः २०२४ तमस्य वर्षस्य प्रथमार्धस्य सशक्ततमः एआइ अस्ति, तथा च Qwen2 इति नवविमोचितं बृहत् मुक्तस्रोतप्रतिरूपं यत् चीनदेशे सर्वाधिकं सशक्तं इति दावान् क्रियते एषः बृहत् मॉडल् श्रृङ्खलायां प्रथमः लेखः अस्ति यत् एतत् शीघ्रं परिनियोजितुं तथा च द्रष्टुं शक्यते यत् यदि प्रभावः ठीकः अस्ति तर्हि स्वस्य GPTs सूक्ष्मरूपेण ट्यून कुर्वन्तु ।
1. Ollama डाउनलोड् कृत्वा इन्स्टॉल कुर्वन्तु
प्रवेशआधिकारिक वेबसाइट Download इति क्लिक् कुर्वन्तु Windos इति चिनोतु, Download for Windows (Preview) इत्यत्र क्लिक् कुर्वन्तु, fq अत्र बहु द्रुततरं भविष्यति पूर्वनिर्धारित स्थापना
2. Qwen2 डाउनलोड् कृत्वा इन्स्टॉल कुर्वन्तु
1. Qwen2 डाउनलोड् कुर्वन्तु
आधिकारिकं पाठ्यक्रमं प्रविष्टं कुर्वन्तु: https://qwen.readthedocs.io/zh-cn/latest/getting_started/installation.html प्रथमं अधः Efficiency Evaluation इत्यत्र क्लिक् कृत्वा प्रत्येकेन मॉडलेन कब्जितं विडियो मेमोरी पश्यन्तु, तथा च यत् भवतः अनुकूलं भवति तत् चिनुत उदाहरणार्थं मम ग्राफिक्स् कार्ड् 4070 अस्ति तथा च 12G विडियो मेमोरी अस्ति। GPTQ-Int4 इत्यस्य निर्देशं ददातु। प्रवेशलिङ्क डाउनलोड करें भवन्तः भिन्नानि प्रत्ययाः पश्यन्ति, q” + भारानाम् संग्रहणार्थं प्रयुक्तानां अङ्कानां संख्या (सटीकता) + विशिष्टं रूपं, संख्या यावन्तः अधिका भवति तावत् उत्तमं प्रदर्शनं भवति संख्या यावन्तः अधिका भवति, तावत् अधिका सटीकता k सर्वेषु ध्यानं तथा फीड_फोरवर्ड टेन्सरेषु 2 अङ्कैः सटीकतायां सुधारं करोति, तथा च m ध्यानस्य आर्धेषु फीड_फोरवर्ड टेन्सरेषु च 2 अङ्कैः सटीकतासु सुधारं करोति। स्वस्य आवश्यकतानुसारं मॉडलं चिनुत अहं प्रत्यक्षतया अत्र Q8 चिनोमि।
2. क्वेन्2 चालयन्तु
नूतनं पुटं रचयन्तु, तस्य आङ्ग्लनाम (qwen) दत्त्वा, qwen2-7b-instruct-q8_0.gguf इत्येतत् पुटे स्थानान्तरयन्तु । फोल्डर् मध्ये Modelfile इति नूतनं सञ्चिकां रचयित्वा पूरयन्तु
FROM ./qwen2-7b-instruct-q8_0.gguf
ततः ollama इत्यस्य माध्यमेन Qwen2-7B मॉडल् निर्मातुं आदेशपङ्क्तौ उपयोगं कुर्वन्तु:
ollama create Qwen2-7B -f ./Modelfile
यदि सफलता भासते सृष्टिः सफला इत्यर्थः ।
धावतु, आदेशं प्रविशतु
ollama run Qwen2-7B
यदा संवादपेटिका दृश्यते तदा भवान् गपशपं कर्तुं शक्नोति
यदि भवान् द्रष्टुम् इच्छति यत् स्थानीयतया के के बृहत् मॉडल् उपलभ्यन्ते: ollama list यदि भवान् एतत् मॉडलं विलोपयितुम् इच्छति: ollama rm xxx यदि भवान् द्रष्टुम् इच्छति यत् के के बृहत् मॉडल् चालिताः आसन्: ollama ps
परन्तु DOS मध्ये गपशपः सर्वदा गतशताब्द्याः गपशपस्य समानं भवति, अतः GPT इत्यस्य भावः अन्वेष्टुं वयं जालपुटे तत् कार्यान्वितं करिष्यामः ।
3. नोड.जस
1.Node.js डाउनलोड् तथा संस्थापनम्
प्रवेशनोड आधिकारिक वेबसाइट Node डाउनलोड् कृत्वा संस्थापयन्तु नोड् संस्करणस्य सत्यापनम् : १.
node -v
यदि v20 अथवा ततः उपरि अस्ति तर्हि तस्य कोऽपि समस्या नास्ति
अवाहरनollama-webui कोड ollama-webui पुटं प्रविश्य घरेलुदर्पणस्रोतं त्वरितरूपेण सेट् कुर्वन्तु:
npm config set registry http://mirrors.cloud.tencent.com/npm/
Node.js निर्भरताः संस्थापयन्तु:
npm install
यदि त्रुटिसन्देशः लेखापरीक्षा आवश्यकी इति वदति तर्हि केवलम् अस्मिन् क्रमेण गच्छन्तु:
npm audit
npm audit fix
जाल-अन्तरफलकं आरभत : १.
npm run dev
उद्घाटितजालपुटम् , वार्तालापं आरभ्य स्वस्य मॉडलं चिनोतु: