बृहत् मॉडल [Qwen2-7B स्थानीय परिनियोजन (WEB संस्करण)] (windows)

2024-07-12

बृहत् मॉडल श्रृङ्खला लेख निर्देशिका

Qwen2-7B स्थानीयनियोजनम् (WEB संस्करणम्)

प्रस्तावना

बृहत् मॉडलः २०२४ तमस्य वर्षस्य प्रथमार्धस्य सशक्ततमः एआइ अस्ति, तथा च Qwen2 इति नवविमोचितं बृहत् मुक्तस्रोतप्रतिरूपं यत् चीनदेशे सर्वाधिकं सशक्तं इति दावान् क्रियते एषः बृहत् मॉडल् श्रृङ्खलायां प्रथमः लेखः अस्ति यत् एतत् शीघ्रं परिनियोजितुं तथा च द्रष्टुं शक्यते यत् यदि प्रभावः ठीकः अस्ति तर्हि स्वस्य GPTs सूक्ष्मरूपेण ट्यून कुर्वन्तु ।

1. Ollama डाउनलोड् कृत्वा इन्स्टॉल कुर्वन्तु

प्रवेशआधिकारिक वेबसाइट
Download इति क्लिक् कुर्वन्तु
Windos इति चिनोतु, Download for Windows (Preview) इत्यत्र क्लिक् कुर्वन्तु, fq अत्र बहु द्रुततरं भविष्यति
पूर्वनिर्धारित स्थापना

2. Qwen2 डाउनलोड् कृत्वा इन्स्टॉल कुर्वन्तु

1. Qwen2 डाउनलोड् कुर्वन्तु

आधिकारिकं पाठ्यक्रमं प्रविष्टं कुर्वन्तु: https://qwen.readthedocs.io/zh-cn/latest/getting_started/installation.html
प्रथमं अधः Efficiency Evaluation इत्यत्र क्लिक् कृत्वा प्रत्येकेन मॉडलेन कब्जितं विडियो मेमोरी पश्यन्तु, तथा च यत् भवतः अनुकूलं भवति तत् चिनुत उदाहरणार्थं मम ग्राफिक्स् कार्ड् 4070 अस्ति तथा च 12G विडियो मेमोरी अस्ति। GPTQ-Int4 इत्यस्य निर्देशं ददातु।
प्रवेशलिङ्क डाउनलोड करें
भवन्तः भिन्नानि प्रत्ययाः पश्यन्ति, q” + भारानाम् संग्रहणार्थं प्रयुक्तानां अङ्कानां संख्या (सटीकता) + विशिष्टं रूपं, संख्या यावन्तः अधिका भवति तावत् उत्तमं प्रदर्शनं भवति
संख्या यावन्तः अधिका भवति, तावत् अधिका सटीकता k सर्वेषु ध्यानं तथा फीड_फोरवर्ड टेन्सरेषु 2 अङ्कैः सटीकतायां सुधारं करोति, तथा च m ध्यानस्य आर्धेषु फीड_फोरवर्ड टेन्सरेषु च 2 अङ्कैः सटीकतासु सुधारं करोति।
स्वस्य आवश्यकतानुसारं मॉडलं चिनुत अहं प्रत्यक्षतया अत्र Q8 चिनोमि।

2. क्वेन्2 चालयन्तु

नूतनं पुटं रचयन्तु, तस्य आङ्ग्लनाम (qwen) दत्त्वा, qwen2-7b-instruct-q8_0.gguf इत्येतत् पुटे स्थानान्तरयन्तु ।
फोल्डर् मध्ये Modelfile इति नूतनं सञ्चिकां रचयित्वा पूरयन्तु

FROM ./qwen2-7b-instruct-q8_0.gguf
1

ततः ollama इत्यस्य माध्यमेन Qwen2-7B मॉडल् निर्मातुं आदेशपङ्क्तौ उपयोगं कुर्वन्तु:

ollama create Qwen2-7B -f ./Modelfile
1

यदि सफलता भासते सृष्टिः सफला इत्यर्थः ।

धावतु, आदेशं प्रविशतु

ollama run Qwen2-7B
1

यदा संवादपेटिका दृश्यते तदा भवान् गपशपं कर्तुं शक्नोति
कृपया चित्रविवरणं योजयन्तु

यदि भवान् द्रष्टुम् इच्छति यत् स्थानीयतया के के बृहत् मॉडल् उपलभ्यन्ते: ollama list
यदि भवान् एतत् मॉडलं विलोपयितुम् इच्छति: ollama rm xxx
यदि भवान् द्रष्टुम् इच्छति यत् के के बृहत् मॉडल् चालिताः आसन्: ollama ps

परन्तु DOS मध्ये गपशपः सर्वदा गतशताब्द्याः गपशपस्य समानं भवति, अतः GPT इत्यस्य भावः अन्वेष्टुं वयं जालपुटे तत् कार्यान्वितं करिष्यामः ।

3. नोड.जस

1.Node.js डाउनलोड् तथा संस्थापनम्

प्रवेशनोड आधिकारिक वेबसाइटNode डाउनलोड् कृत्वा संस्थापयन्तु
नोड् संस्करणस्य सत्यापनम् : १.

node -v
1

यदि v20 अथवा ततः उपरि अस्ति तर्हि तस्य कोऽपि समस्या नास्ति

अवाहरनollama-webui कोड
ollama-webui पुटं प्रविश्य घरेलुदर्पणस्रोतं त्वरितरूपेण सेट् कुर्वन्तु:

npm config set registry http://mirrors.cloud.tencent.com/npm/
1

Node.js निर्भरताः संस्थापयन्तु:

npm install
1

यदि त्रुटिसन्देशः लेखापरीक्षा आवश्यकी इति वदति तर्हि केवलम् अस्मिन् क्रमेण गच्छन्तु:

npm audit
npm audit fix
1
2

जाल-अन्तरफलकं आरभत : १.

npm run dev
1

उद्घाटितजालपुटम्, वार्तालापं आरभ्य स्वस्य मॉडलं चिनोतु:
कृपया चित्रविवरणं योजयन्तु

प्रौद्योगिकी साझेदारी