Κοινή χρήση τεχνολογίας

Εφαρμογή μοντέλου μεγάλης γλώσσας -- Εφαρμογή μηχανικής τεχνητής νοημοσύνης

2024-07-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Κατάλογος άρθρων


Η ραγδαία ανάπτυξη της τεχνητής νοημοσύνης τα τελευταία χρόνια έφερε πράγματι μεγάλο αντίκτυπο, ωστόσο, στην πραγματικότητα, η τεχνητή νοημοσύνη δεν έχει ξεπεράσει εντελώς τα σύνορα και εξακολουθεί να «αυτοπροβάλλεται» σε έναν μικρό κύκλο.Αλλά είναι πολύ διαφορετικό από πριν.
Αυτό το άρθρο θα επικεντρωθεί στην τρέχουσα κατάσταση των μεγάλων μοντέλων και θα μιλήσει για πράγματα που σχετίζονται με την υλοποίηση της μηχανικής.

Δεν θα υπεισέλθω σε πολλές λεπτομέρειες για την ίδια την τεχνητή νοημοσύνη εδώ, αλλά θα επικεντρωθώ περισσότερο σε εφαρμογές ανώτερου επιπέδου.

Επισκόπηση μεγάλων γλωσσικών μοντέλων

Όταν μιλάμε για ένα μεγάλο γλωσσικό μοντέλο, αναφερόμαστε σε ένα λογισμικό που μπορεί να «μιλήσει» με τρόπο παρόμοιο με την ανθρώπινη γλώσσα.Αυτά τα μοντέλα είναι εκπληκτικά – μπορούν να πάρουν το πλαίσιο και να δημιουργήσουν απαντήσεις που όχι μόνο είναι συνεκτικές αλλά νιώθουν ότι προέρχονται από πραγματικούς ανθρώπους
Αυτά τα γλωσσικά μοντέλα λειτουργούν με την ανάλυση μεγάλων ποσοτήτων δεδομένων κειμένου και προτύπων εκμάθησης στη χρήση της γλώσσας.Εκμεταλλεύονται αυτά τα μοτίβα για να δημιουργήσουν κείμενο που είναι σχεδόν αδιάκριτο από αυτό που λένε ή γράφουν οι άνθρωποι.
Εάν έχετε συνομιλήσει ποτέ με έναν εικονικό βοηθό ή έχετε αλληλεπιδράσει με έναν πράκτορα εξυπηρέτησης πελατών AI, πιθανότατα έχετε αλληλεπιδράσει με ένα μεγάλο μοντέλο γλώσσας χωρίς καν να το καταλάβετε Αυτά τα μοντέλα έχουν ένα ευρύ φάσμα εφαρμογών, από chatbots έως μετάφραση γλώσσας έως περιεχόμενο! δημιουργία και άλλα

Τι είναι ένα μεγάλο γλωσσικό μοντέλο

  • ορισμός : Το Large Language Model (LLM) είναι ένα προεκπαιδευμένο μοντέλο επεξεργασίας φυσικής γλώσσας (NLP), συνήθως με δισεκατομμύρια ή και εκατοντάδες δισεκατομμύρια παραμέτρους, ικανό να κατανοεί και να δημιουργεί κείμενο φυσικής γλώσσας.Τα δεδομένα εκπαίδευσης για ένα ώριμο μοντέλο μεγάλης γλώσσας είναι τεράστια.
  • Λειτουργία: Τα μεγάλα γλωσσικά μοντέλα μπορούν να εκτελέσουν μια ποικιλία γλωσσικών εργασιών, όπως ταξινόμηση κειμένου, ανάλυση συναισθημάτων, μηχανική μετάφραση, σύνοψη κειμένου, συστήματα ερωτήσεων και απαντήσεων κ.λπ.
  • τεχνική βάση: Βασίζεται στην αρχιτεκτονική του Transformer, με χρήση του μηχανισμού Self-Attention για την επεξεργασία δεδομένων ακολουθίας
  • αναπτύσσω: Από τα πρώτα RNN και LSTM έως τα τρέχοντα μοντέλα όπως το BERT και το GPT, ο αριθμός των παραμέτρων και η απόδοση συνέχισαν να βελτιώνονται.

Τι είναι η μηχανική μάθηση

  • ορισμός: Η μηχανική μάθηση είναι ένας κλάδος της τεχνητής νοημοσύνης που επιτρέπει στα συστήματα υπολογιστών να μαθαίνουν από δεδομένα και να λαμβάνουν αποφάσεις ή προβλέψεις χωρίς να είναι ρητά προγραμματισμένοι
  • τύπος: Συμπεριλαμβανομένης της εποπτευόμενης μάθησης, της μάθησης χωρίς επίβλεψη, της ημι-εποπτευόμενης μάθησης και της ενισχυτικής μάθησης
  • εφαρμογή: Χρησιμοποιείται ευρέως στην αναγνώριση εικόνων, την αναγνώριση ομιλίας, τα συστήματα συστάσεων, την προγνωστική ανάλυση και άλλα πεδία
  • Βασικές έννοιες: Επιλογή χαρακτηριστικών, εκπαίδευση μοντέλου, υπερπροσαρμογή και υποσυναρμολόγηση, αξιολόγηση μοντέλου κ.λπ.

Τι είναι βαθιά μάθηση

  • ορισμός: Η βαθιά μάθηση είναι ένα υποσύνολο της μηχανικής μάθησης που χρησιμοποιεί μια δομή νευρωνικού δικτύου παρόμοια με τον ανθρώπινο εγκέφαλο για την εκμάθηση πολύπλοκων μοτίβων δεδομένων μέσω πολυεπίπεδων (βαθύ) μη γραμμικών μετασχηματισμών.
  • βασικά στοιχεία: Επίπεδα νευρωνικών δικτύων, συναρτήσεις ενεργοποίησης, συναρτήσεις απώλειας, αλγόριθμοι βελτιστοποίησης.
  • Αρχιτεκτονική: Συμπεριλαμβανομένου του συνελικτικού νευρωνικού δικτύου (CNN), του επαναλαμβανόμενου νευρωνικού δικτύου (RNN), του δικτύου βραχυπρόθεσμης μνήμης (LSTM) και του μετασχηματιστή (Transformer) κ.λπ.
  • εφαρμογή: Επαναστατική πρόοδος έχει σημειωθεί στους τομείς της αναγνώρισης εικόνας και ομιλίας, επεξεργασίας φυσικής γλώσσας, αυτόνομης οδήγησης κ.λπ.

Κατανόηση μεγάλων γλωσσικών μοντέλων

Γιατί πρέπει να ανοίξω ένα ξεχωριστό κεφάλαιο για να "κατανοήσω" μεγάλα γλωσσικά μοντέλα αφού έχω μια επισκόπηση των μεγάλων γλωσσικών μοντέλων παραπάνω, επειδή αυτό θα σας επιτρέψει να γνωρίζετε καλύτερα τι είναι ένα μεγάλο γλωσσικό μοντέλο, να κατανοήσετε το ανώτερο όριο του και επίσης μπορεί; να μας διευκολύνει να κάνουμε καλύτερα το επίπεδο εφαρμογής.
Πρώτα απ 'όλα, μπορούμε να πούμε γενικά ότι η μηχανική μάθηση είναι να βρούμε μια ειδική περίπλοκη «συνάρτηση» που μπορεί να μετατρέψει την είσοδο μας στην επιθυμητή έξοδο. Για παράδειγμα, αν αναμένουμε να εισαγάγουμε την είσοδο 1 και την έξοδο 5 στην είσοδο 2 και την έξοδο 10, τότε αυτή η συνάρτηση μπορεί να είναι y=2*x.Ή αν εισάγουμε μια εικόνα μιας γάτας, θέλω να βγάζει τη λέξη "γάτα" ή αν βάλω "γεια" θα βγάζει "γεια" κ.λπ.

Στην πραγματικότητα, αυτό μπορεί να θεωρηθεί ως ένα μαθηματικό πρόβλημα στην ουσία. Φυσικά, το πραγματικό πρόβλημα θα είναι πολύ πιο περίπλοκο από το παραπάνω παράδειγμα.

Ιστορία

1. Στις πρώτες μέρες, οι άνθρωποι ήθελαν πάντα να κάνουν τις μηχανές να σκέφτονται όπως οι άνθρωποι Εκείνη την εποχή, οι άνθρωποι προώθησαν κυρίως τη «σχολή πτήσεων πουλιών», όταν οι άνθρωποι έβλεπαν ένα πουλί να πετάει φτερά τότε ήλπιζαν να κάνουν τις μηχανές να σκέφτονται σαν άνθρωποι. Αλλά αυτό το αποτέλεσμα δεν είναι πολύ καλό Δεν υπάρχει «παγκόσμια γνώση» (η παγκόσμια γνώση είναι η προεπιλεγμένη γνώση που είναι γνωστή και ενστικτώδης χωρίς σκέψη). είναι τεράστιο και είναι δύσκολο να λυθεί το πρόβλημα των πολλαπλών σημασιών με μία λέξη.Σε γενικές γραμμές, είναι πολύ περίπλοκο να μιμηθείς τον ανθρώπινο εγκέφαλο και είναι δύσκολο να το πετύχεις απλά χρησιμοποιώντας κώδικες και λειτουργίες.

2. Εποχή Τεχνητής Νοημοσύνης 2.0: εφαρμογή βάσει δεδομένων «τεχνητής νοημοσύνης βάσει στατιστικών». Γιατί όλα τα είδη μεγάλων μοντέλων ξεπήδησαν σαν μανιτάρια μετά από βροχή μετά την εμφάνιση του GPT3; Στην πραγματικότητα, οι περισσότερες εταιρείες ερευνούσαν την τεχνητή νοημοσύνη για μεγάλο χρονικό διάστημα, αλλά τις πρώτες μέρες, όλοι διέσχιζαν το ποτάμι νιώθοντας τις πέτρες, αν και υπήρχαν πολλά σχέδια και σκέψεις, δεν τολμούσαν να αυξήσουν την επένδυσή τους σε καρφιά ήταν όλα εντός περιορισμένου πεδίου έρευνας. Η εμφάνιση του GPT3 επέτρεψε σε όλους να δουν ότι μια συγκεκριμένη μέθοδος είναι εφικτή, η οποία είναι η χρήση τεράστιων ποσοτήτων δεδομένων για τον υπολογισμό των στατιστικών στοιχείων. Οι αλλαγές στην ποσότητα οδηγούν σε ποιοτικές αλλαγές ξεκίνησε Αυξήστε τις επενδύσεις και ακολουθήστε αυτόν τον δρόμο

3. Τα μεγάλα δεδομένα μπορούν να κάνουν το επίπεδο νοημοσύνης των μηχανών να κάνει άλμα προς τα εμπρός.

  • Βασική ιδέα: Με βάση στατιστικές πληροφορίες σε μεγάλο όγκο δεδομένων, "παραμέτρους τρένου" για να ταιριάζουν στα αποτελέσματα (η ουσία είναι "στατιστικά" και όχι "βιονικά")
  • Κύρια πλεονεκτήματα: Καθώς ο όγκος των δεδομένων συσσωρεύεται, το σύστημα θα συνεχίσει να βελτιώνεται και να γίνεται όλο και καλύτερο.
  • Βασικά στοιχεία: «μεγάλα δεδομένα», μαζικά, πολυδιάστατα και περιεκτικά μεγάλα δεδομένα
  • "Rote Learning" που βασίζεται σε μαζικά, πολυδιάστατα και ολοκληρωμένα μεγάλα δεδομένα.
    Μέσω της στατιστικής τεχνητής νοημοσύνης, τα «προβλήματα νοημοσύνης» μετατρέπονται σε «προβλήματα δεδομένων», κάνοντας υπολογιστές
    Οι μηχανές μπορούν να λύσουν «αβέβαια προβλήματα» μαθαίνοντας από μεγάλα δεδομένα

Το ουσιώδες

Έτσι, το κλειδί του προβλήματος γίνεται ζήτημα πιθανότητας. Επί του παρόντος, τα μεγάλα μοντέλα υπολογίζουν μια πιθανότητα από τεράστια δεδομένα για να προσδιορίσουν την υψηλότερη πιθανότητα του επόμενου κειμένου ή μιας συγκεκριμένης παραγράφου κειμένου στη μέση και στη συνέχεια να την εξάγουν.Στην πραγματικότητα, η ουσία δεν είναι να δημιουργείς νέα πράγματα, αλλά να συλλογίζεσαι.

Για παράδειγμα, ρωτήστε τον πού είναι η πρωτεύουσα της Κίνας;Η λέξη-κλειδί που εξάγεται μέσω του αλγόριθμου είναι ότι η πρωτεύουσα της Κίνας είναι
Στη συνέχεια, το μεγάλο μοντέλο υπολογίζει από τα τεράστια δεδομένα ότι η πρωτεύουσα της Κίνας είναι η πιο πιθανή λέξη που ακολουθείται από το Πεκίνο, οπότε θα βγάλει το σωστό αποτέλεσμα.

Μεγάλα μοντέλα βασίζονται στην «αυθεντική εκμάθηση» τεράστιων ποσοτήτων δεδομένων για να επιτύχουν τις τρέχουσες δυνατότητες.
Επομένως, η ποιότητα των δεδομένων για την εκπαίδευση μεγάλων μοντέλων είναι επίσης πολύ κρίσιμη. Ταυτόχρονα, μπορούμε σχεδόν να σκεφτούμε το ανώτατο όριο των μεγάλων μοντέλων.

Σύστημα AIGC

Το AIGC ή Περιεχόμενο που δημιουργείται από Τεχνητή Νοημοσύνη, είναι μια τεχνολογία που χρησιμοποιεί αλγόριθμους μηχανικής μάθησης για να δημιουργεί αυτόματα διάφορους τύπους περιεχομένου, συμπεριλαμβανομένων κειμένου, εικόνων, ήχου και βίντεο. Αναλύοντας μεγάλους όγκους δεδομένων, τα συστήματα AIGC μαθαίνουν γλωσσικά, οπτικά και ακουστικά μοτίβα για να δημιουργήσουν νέο περιεχόμενο που είναι παρόμοιο ή ακόμα και δυσδιάκριτο από το περιεχόμενο που έχει δημιουργηθεί από τον άνθρωπο.
Όλη η ψηφιακή εργασία είναι πιθανό να ανατραπεί από "μεγάλα μοντέλα"
Το μεγαλύτερο μέρος της τρέχουσας εργασίας μας στο επίπεδο εφαρμογής ανήκει στο σύστημα AIGC
Μετά το GPT3.5, τα μεγάλα μοντέλα μπορούν ήδη να χρησιμοποιούν εργαλεία.
• Πρόσθετα και δικτύωση: αναπλήρωση της έλλειψης μνήμης του ίδιου του μεγάλου μοντέλου, σηματοδοτώντας την επίσημη έναρξη της LLM εκμάθησης χρήσης εργαλείων
• Λειτουργία: Το LLM μαθαίνει να καλεί API για την ολοκλήρωση πολύπλοκων εργασιών, η οποία είναι η κύρια δουλειά των μηχανικών back-end (δώστε οδηγίες στον Gorilla και θα καλέσει αυτόματα μοντέλα όπως η διάχυση για να υλοποιήσει εργασίες πολλαπλών τρόπων, όπως η σχεδίαση και ο διάλογος)
• Αφήστε το μοντέλο να «σκέφτεται»: καθοδηγήστε μεγάλα μοντέλα ώστε να έχουν λογικές δυνατότητες, ο πυρήνας βρίσκεται στο: «Εργαλείο μνήμης προγραμματισμού»

Υλοποίηση έργων μηχανικής τεχνητής νοημοσύνης

Στην πραγματικότητα, η υλοποίηση των έργων τεχνητής νοημοσύνης είναι η ίδια με εκείνη των συνηθισμένων έργων Ο πυρήνας της αρχικής ίδρυσης του έργου πρέπει να είναι η σαφής κατανόηση των βασικών προβλημάτων που προορίζεται να λύσει το έργο και στη συνέχεια να επεκταθεί η σκέψη και στη συνέχεια να πραγματοποιηθεί. ανάλυση ζήτησης, επιλογή τεχνολογίας κ.λπ.Δεν είμαστε πολύ καλοί στο σχεδιασμό μεγάλων μοντέλων για το επίπεδο εφαρμογής Συνήθως καλούμε απευθείας API ή αναπτύσσουμε τοπικά μεγάλα μοντέλα ανοιχτού κώδικα.

Πώς να προσγειωθείτε

Prompt Project (Φάση 1)

Οποιοσδήποτε είχε λίγη επαφή με την τεχνητή νοημοσύνη μπορεί να γνωρίζει προτροπή Το 2022-2023, η αρχική έρευνα για την τεχνητή νοημοσύνη θα συνεχίσει να βασίζεται σε αυτό, δηλαδή πώς να κάνετε ερωτήσεις για να κατανοήσετε καλύτερα το νόημά σας, δώστε προσοχή στο κλειδί σας. πόντους και στη συνέχεια να παρέχει καλύτερης ποιότητας απαντήσεις του Gao
Το όριο είναι σχετικά χαμηλό και οι περισσότερες εφαρμογές μεγάλων μοντέλων σχεδιάζονται με Prompt.Το να μπορείς να καλύψεις κάποιες ανάγκες εξαρτάται από τις δυνατότητες του βασικού μοντέλου

Αναζήτηση RAG (δεύτερο στάδιο)

Το RAG (Retrieval-Augmented Generation) είναι μια τεχνολογία τεχνητής νοημοσύνης που συνδυάζει μοντέλα ανάκτησης και μοντέλα παραγωγής. Ενισχύει τις δυνατότητες απάντησης των μεγάλων γλωσσικών μοντέλων (LLM) ανακτώντας σχετικές πληροφορίες από μια βάση γνώσεων ή βάση δεδομένων και συνδυάζοντάς τις με ερωτήματα χρήστη. Η τεχνολογία RAG μπορεί να βελτιώσει την ακρίβεια και τη συνάφεια των εφαρμογών AI, ειδικά σε σενάρια που αφορούν συγκεκριμένες γνώσεις τομέα ή απαιτούν τις πιο πρόσφατες πληροφορίες.
Η αρχή λειτουργίας του RAG περιλαμβάνει κυρίως δύο βήματα:

  1. Ανάκτηση: Με βάση το ερώτημα του χρήστη, το RAG χρησιμοποιεί το μοντέλο ανάκτησης για την αναζήτηση και εξαγωγή των πιο σχετικών πληροφοριών ή εγγράφων στη βάση γνώσεων.
  2. Δημιουργία: Οι πληροφορίες που ανακτώνται χρησιμοποιούνται ως είσοδος στο μοντέλο παραγωγής, μαζί με το ερώτημα χρήστη, από το οποίο το μοντέλο παραγωγής δημιουργεί απαντήσεις ή περιεχόμενο.
    Τα πλεονεκτήματα της τεχνολογίας RAG είναι:
    • Ενημέρωση γνώσης: Δυνατότητα πρόσβασης στις πιο πρόσφατες πληροφορίες, όχι μόνο στη γνώση κατά την εκπαίδευση μοντέλων
    • Μειώστε τις παραισθήσεις: Μειώστε την τάση του LLM να παράγει ανακριβείς ή ψευδείς πληροφορίες μέσω της βοήθειας εξωτερικών πηγών γνώσης
    • Ασφάλεια δεδομένων: Επιτρέπει στις επιχειρήσεις να χρησιμοποιούν ιδιωτικά δεδομένα χωρίς να τα ανεβάζουν σε πλατφόρμες τρίτων
    • Οικονομικά: Η RAG παρέχει μια πιο οικονομική λύση από την επανεκπαίδευση ή τη λεπτή ρύθμιση μεγάλων μοντέλων
Μοντέλα ειδικά για τη λειτουργία εκπαίδευσης (Φάση 3)

Ωστόσο, αυτό το όριο είναι σχετικά υψηλό και υπάρχουν ορισμένες απαιτήσεις για υπολογιστική ισχύ, δεδομένα και αλγόριθμους.

Υλοποιημένος επιχειρηματικός σχεδιασμός

Βήμα πρώτο: Ιδεασμός και εξερεύνηση

Στόχος: Διεξαγωγή επαλήθευσης σκοπιμότητας, σχεδίαση πρωτοτύπου με βάση τις επιχειρηματικές απαιτήσεις και δημιουργία PromptFlow για τη δοκιμή βασικών υποθέσεων

  • Βασική εισαγωγή: Σαφείς επιχειρηματικοί στόχοι
  • Έξοδος κλειδιού: Επαληθεύστε εάν το μοντέλο μεγάλης γλώσσας (LLM) μπορεί να ικανοποιήσει τις απαιτήσεις εργασιών, να δημιουργήσει ή να απορρίψει βασικές υποθέσεις
  • Βασικά σχέδια δράσης:
    • Καθορίστε με σαφήνεια τις περιπτώσεις επιχειρηματικής χρήσης
    • Επιλέξτε ένα κατάλληλο βασικό μοντέλο μεγάλου μεγέθους και προετοιμάστε τα απαραίτητα δεδομένα για μετέπειτα μικρορύθμιση (SFT) ή άλλες χρήσεις
    • Σχεδιάστε και δημιουργήστε PromptFlow, διατυπώστε και δοκιμάστε υποθέσεις σκοπιμότητας
Βήμα 2: Δημιουργία και βελτίωση

Στόχος: Αξιολόγηση της ευρωστίας των λύσεων σε ένα μεγαλύτερο εύρος συνόλων δεδομένων και βελτίωση της απόδοσης του μοντέλου μέσω τεχνικών όπως η μικρορύθμιση (SFT) και η επαυξημένη παραγωγή ανάκτησης (RAG)

  • Βασικά στοιχεία: Επιχειρηματικοί στόχοι σε συνδυασμό με προκαταρκτικό σχέδιο (αποτελέσματα του βήματος 1)
  • Βασικό αποτέλεσμα: Μια ώριμη επιχειρηματική λύση, έτοιμη να αναπτυχθεί σε ένα σύστημα παραγωγής
  • Βασικά σχέδια δράσης:
    • Επαληθεύστε την αποτελεσματικότητα του PromptFlow σε δείγματα δεδομένων
    • Αξιολογήστε και βελτιστοποιήστε το PromptFlow και εξερευνήστε καλύτερα μηνύματα και εργαλεία
    • Εάν επιτευχθούν οι αναμενόμενοι στόχοι, επεκταθείτε σε ένα μεγαλύτερο σύνολο δεδομένων για δοκιμή και βελτιώστε περαιτέρω το αποτέλεσμα μέσω SFT, RAG και άλλων τεχνολογιών.
Βήμα 3: Συνεχίστε τις λειτουργίες

Στόχος: Διασφάλιση της σταθερής λειτουργίας του συστήματος AIGC, ενοποίηση συστημάτων παρακολούθησης και συναγερμού και επίτευξη συνεχούς ενοποίησης και συνεχούς ανάπτυξης (CI/CD)

  • Βασική είσοδος: ένα σύστημα AIGC ικανό να λύσει ένα συγκεκριμένο πρόβλημα
  • Βασικά αποτελέσματα: Διαδικασίες σε επίπεδο παραγωγής που ενσωματώνουν συστήματα παρακολούθησης και προειδοποίησης και διαδικασίες CI/CD.
  • Βασικά σχέδια δράσης:
    • Αναπτύξτε το σύστημα AIGC
    • Ενσωματώστε τις δυνατότητες παρακολούθησης και ειδοποίησης για να διασφαλίσετε ότι οι δυνατότητες του συστήματος είναι ενσωματωμένες στις εφαρμογές
    • Δημιουργία μηχανισμού λειτουργίας της εφαρμογής, συμπεριλαμβανομένης της συνεχούς επανάληψης, της ανάπτυξης και της ενημέρωσης
      Μέσω αυτής της διαδικασίας, διασφαλίζουμε ότι κάθε βήμα από την απόδειξη της ιδέας έως την ανάπτυξη της παραγωγής είναι ακριβές, ελεγχόμενο και καθοδηγούμενο από επιχειρηματικούς στόχους

Άμεση τεχνολογία

1. Ο κινητήριος ρόλος των θραυσμάτων του κύριου περιεχομένου

Τα κύρια αποσπάσματα περιεχομένου είναι η κειμενική βάση που χρησιμοποιείται σε συνδυασμό με οδηγίες για να αυξηθεί σημαντικά η αποτελεσματικότητά τους.

  1. Ορισμός κύριου περιεχομένου:
    • Το κύριο περιεχόμενο είναι το βασικό κείμενο της επεξεργασίας ή του μετασχηματισμού μοντέλου, που συνήθως συνδυάζεται με οδηγίες για την επίτευξη συγκεκριμένων στόχων.
  2. Παραδείγματα εφαρμογών:
    • Παράδειγμα 1: Δώστε ένα κομμάτι κειμένου [κείμενο] της Wikipedia με την οδηγία "Παρακαλώ συνοψίστε το παραπάνω περιεχόμενο".
    • Παράδειγμα 2: Δεδομένου ενός πίνακα που περιέχει πληροφορίες για μπύρα [κείμενο], η οδηγία είναι "Καταγράψτε όλες τις μπύρες στον πίνακα με βαθμό μικρότερο από 6 μοίρες."

2. Στρατηγική υλοποίησης κύριου περιεχομένου

Συγκεκριμένες μέθοδοι για την επίτευξη του κύριου περιεχομένου, όπως:

  • Παράδειγμα: Επιτρέπει στο μοντέλο να συμπεράνει αυτόνομα τις ενέργειες που πρέπει να εκτελεστούν παρέχοντας παραδείγματα για τον τρόπο ολοκλήρωσης μιας εργασίας αντί για άμεσες οδηγίες.
  • Cue: Χρησιμοποιήστε οδηγίες με ενδείξεις για να καθοδηγήσετε το μοντέλο στη λογική βήμα προς βήμα για να καταλήξετε στην απάντηση.
  • Πρότυπα: Παρέχει επαναχρησιμοποιήσιμες άμεσες συνταγές με σύμβολα κράτησης θέσης, επιτρέποντας την προσαρμογή σε συγκεκριμένες περιπτώσεις χρήσης.

3. Η δύναμη των παραδειγμάτων (Παράδειγμα)

Δείχνοντας στο μοντέλο πώς να δημιουργεί έξοδο με βάση δεδομένες οδηγίες, το μοντέλο μπορεί να συμπεράνει μοτίβα εξόδου, είτε μάθηση μηδενικής λήψης, μίας λήψης ή μάθησης με λίγες λήψεις.

  • συστατικό:
    • Συνολική περιγραφή της αποστολής.
    • Ένα παράδειγμα μιας περιοχής επιθυμητής εξόδου.
    • Ένας οδηγός για νέα παραδείγματα που χρησιμεύουν ως αφετηρία για επόμενες εργασίες.

4. Ο καθοδηγητικός ρόλος των ενδείξεων (Cue)

Παρέχοντας ενδείξεις σε μεγάλα μοντέλα για να τα καθοδηγήσετε στη λογική συλλογιστική προς μια σαφή κατεύθυνση, είναι παρόμοιο με την παροχή μιας φόρμουλας βήμα προς βήμα για να βοηθήσετε το μοντέλο να λάβει σταδιακά την απάντηση.

5. Τιμή προσαρμογής προτύπων (Πρότυπο)

Η αξία των προτύπων έγκειται στη δημιουργία και δημοσίευση βιβλιοθηκών προτροπών για συγκεκριμένες περιοχές εφαρμογών που έχουν βελτιστοποιηθεί για το συγκεκριμένο περιβάλλον ή παράδειγμα της εφαρμογής.

  • Συμβουλή βελτιστοποίησης: Κάντε τις απαντήσεις πιο σχετικές και ακριβείς με την ομάδα χρηστών-στόχων σας.
  • Αναφορά πόρων: Η σελίδα δείγματος OpenAI API παρέχει πληθώρα πόρων προτύπων.
  • Ανάθεση ρόλων μοντέλου: Βελτιώστε την κατανόηση του μοντέλου σχετικά με τη συνάφεια της εργασίας καθορίζοντας ρόλους ταυτότητας μοντέλου (όπως σύστημα, χρήστης, βοηθός κ.λπ.).

Προηγμένα παραδείγματα

# 职位描述:数据分析助手
## 角色
我的主要目标是为用户提供专家级的数据分析建议。利用详尽的数据资源,告诉我您想要分析的股票(提供股票代码)。我将以专家的身份,为您的股票进行基础分析、技
术分析、市场情绪分析以及宏观经济分析。
## 技能
### 技能1:使用Yahoo Finance的'Ticker'搜索股票信息
### 技能2:使用'News'搜索目标公司的最新新闻
### 技能3:使用'Analytics'搜索目标公司的财务数据和分析
## 工作流程
询问用户需要分析哪些股票,并按顺序执行以下分析:
**第一部分:基本面分析:财务报告分析
*目标1:对目标公司的财务状况进行深入分析。
*步骤:
1. 确定分析对象: