Το μεγάλο μοντέλο είναι το ισχυρότερο AI από το πρώτο εξάμηνο του 2024 και το Qwen2 είναι ένα νέο μοντέλο μεγάλου ανοιχτού κώδικα που κυκλοφόρησε πρόσφατα, το οποίο υποστηρίζεται ότι είναι το ισχυρότερο στην Κίνα. Αυτό είναι το πρώτο άρθρο στη σειρά μεγάλων μοντέλων. Έχει σχεδιαστεί για να αναπτύσσει γρήγορα και να βλέπει πώς αποδίδουν τα μεγάλα μοντέλα που κυκλοφόρησαν πρόσφατα, ρυθμίστε τα δικά σας GPT.
Επιλέξτε Windos, κάντε κλικ στην επιλογή Λήψη για Windows (Προεπισκόπηση), το fq θα είναι πολύ πιο γρήγορο εδώ
Προεπιλεγμένη εγκατάσταση
2. Κατεβάστε και εγκαταστήστε το Qwen2
1. Κατεβάστε το Qwen2
Εισαγάγετε τον επίσημο οδηγό: https://qwen.readthedocs.io/zh-cn/latest/getting_started/installation.html
Πρώτα κάντε κλικ στο Efficiency Evaluation στο κάτω μέρος, δείτε τη μνήμη βίντεο που καταλαμβάνει κάθε μοντέλο και επιλέξτε αυτό που σας ταιριάζει. Για παράδειγμα, η κάρτα γραφικών μου είναι 4070 και έχει μνήμη βίντεο 12G. Εντολή GPTQ-Int4.
Θα δείτε διαφορετικά επιθήματα, q” + τον αριθμό των ψηφίων που χρησιμοποιούνται για την αποθήκευση των βαρών (ακρίβεια) + τη συγκεκριμένη παραλλαγή, όσο μεγαλύτερος είναι ο αριθμός τόσο καλύτερη είναι η απόδοση.
Όσο μεγαλύτερος είναι ο αριθμός, τόσο μεγαλύτερη η ακρίβεια k βελτιώνει την ακρίβεια κατά 2 ψηφία σε όλους τους τανυστές προσοχής και τροφοδοσίας, και το m βελτιώνει την ακρίβεια κατά 2 ψηφία στο μισό των τανυστών προσοχής και τροφοδοσίας.
Επιλέξτε ένα μοντέλο σύμφωνα με τις δικές σας ανάγκες Επέλεξα απευθείας το Q8 εδώ.
2. Εκτελέστε το Qwen2
Δημιουργήστε έναν νέο φάκελο, δώστε του ένα αγγλικό όνομα (qwen) και μετακινήστε το qwen2-7b-instruct-q8_0.gguf στον φάκελο.
Δημιουργήστε ένα νέο αρχείο με το όνομα Modelfile στον φάκελο και συμπληρώστε το
FROM ./qwen2-7b-instruct-q8_0.gguf
1
Στη συνέχεια, χρησιμοποιήστε τη γραμμή εντολών για να δημιουργήσετε το μοντέλο Qwen2-7B μέσω του olama:
ollama create Qwen2-7B -f ./Modelfile
1
Εάν εμφανιστεί επιτυχία, σημαίνει ότι η δημιουργία είναι επιτυχής.
Εκτέλεση, πληκτρολογήστε την εντολή
ollama run Qwen2-7B
1
Όταν εμφανιστεί ένα πλαίσιο διαλόγου, μπορείτε να συνομιλήσετε
Αν θέλετε να δείτε ποια μεγάλα μοντέλα είναι διαθέσιμα τοπικά: λίστα olama Εάν θέλετε να διαγράψετε αυτό το μοντέλο: olama rm xxx Αν θέλετε να δείτε ποια μεγάλα μοντέλα εκτελέστηκαν: olama ps
Αλλά η συνομιλία στο DOS έχει πάντα την ίδια αίσθηση με τη συνομιλία τον περασμένο αιώνα, οπότε για να βρούμε την αίσθηση του GPT, θα συνεχίσουμε να την εφαρμόζουμε στον ιστό.