Condivisione della tecnologia

Meta rilascia il generatore di codice AI basato su Llama 2: Code Llama, l'open source sta arrivando!

2024-07-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Meta è appena stato lanciato, sostenendo di essere il “modello di linguaggio di grandi dimensioni più avanzato” nel campo della programmazione——
Codice lama
, può essere basato su
Suggerimenti sul codice e sul linguaggio naturale
Genera codice e linguaggio naturale sul codice, supportando più linguaggi di programmazione tradizionali,
Include Python, C, Java, PHP, Typescript (Javascript), C# e Bash

Code Llama è completamente gratuito per la ricerca e l'uso commerciale ed è stato rilasciato su GitHub:
Italiano: Italiano: https://www.jlht168.com/post/m1/Jryk1eDMBdAR.html

Code Llama si basa sui principali modelli linguistici di Llama 2 e fornisce tre modelli:

  • Codice lama
  • Modello di codice di base
  • Codice Llama - Python
  • Specificamente ottimizzato per Python
  • Codice Llama - Istruisci
  • Progettato specificamente per comprendere le istruzioni del linguaggio naturale

Esegui l'esempio

  • Genera codice basato sul linguaggio naturale

  • Spiegare la funzione/struttura del codice

Code Llama fornisce tre modelli di diverse dimensioni, rispettivamente con parametri 7B, 13B e 34B, che possono essere utilizzati per il completamento del codice e il debug. Ogni modello viene addestrato utilizzando token di codice 500B e dati relativi al codice. Inoltre, i modelli base 7B e 13B e i modelli di istruzioni vengono addestrati con la funzione fill-in-the-middle (FIM), che supporta la funzione di inserimento del codice. codice esistente.

Meta afferma che i tre modelli di diverse dimensioni soddisfano diversi requisiti di servizio e latenza. Ad esempio, il modello 7B può funzionare su una singola GPU. Il modello 34B restituisce i risultati migliori e fornisce una migliore assistenza nella codifica, ma i modelli più piccoli 7B e 13B sono più veloci e più adatti per attività che richiedono bassa latenza, come il completamento del codice in tempo reale.

Secondo i dati forniti da Meta, Code Llama supera le soluzioni esistenti ed è alla pari con ChatGPT sui popolari benchmark di codifica HumanEval e Mostly Basic Python Programming (MBPP).