LangChain - kehote template_developdoc multimodaalisille suurille malleille

LangChain - pikamalli multimodaalisille suurille malleille

2024-07-12

Artikkelihakemisto

1. Kuinka siirtää multimodaalista dataa suoraan malliin
2. Kuinka käyttää mutimodaalisia kehotteita

1. Kuinka siirtää multimodaalista dataa suoraan malliin

Tässä näytämme kuinka multimodaalinen syöte välitetään suoraan malliin. Muille mallintarjoajille, jotka tukevat multimodaalista syöttöä, langchain tarjoaa luokassa luontaisen logiikan muuntaaksesi haluttuun muotoon.
Yleisin tapa siirtää kuva on tavumerkkijono. Tämän pitäisi toimia useimmissa mallikokonaisuuksissa.

import base64
import httpx

image_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
image_data = base64.b64encode(httpx.get(image_url).content).decode("utf-8")

message = HumanMessage(
    content=[
        {"type": "text", "text": "describe the weather in this image"},
        {
            "type": "image_url",
            "image_url": {"url": f"data:image/jpeg;base64,{image_data}"},
        },
    ],
)
response = model.invoke([message])
print(response.content)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

Voimme antaa kuvan URL-osoitteen suoraan "image_URL"-tyypin sisältölohkoon. Huomaa kuitenkin, että vain jotkin mallintoimittajat tukevat tätä ominaisuutta.

message = HumanMessage(
    content=[
        {"type": "text", "text": "describe the weather in this image"},
        {"type": "image_url", "image_url": {"url": image_url}},
    ],
)
response = model.invoke([message])
print(response.content)
1
2
3
4
5
6
7
8

Voimme myös ladata useita kuvia.

message = HumanMessage(
    content=[
        {"type": "text", "text": "are these two images the same?"},
        {"type": "image_url", "image_url": {"url": image_url}},
        {"type": "image_url", "image_url": {"url": image_url}},
    ],
)
response = model.invoke([message])
print(response.content)
1
2
3
4
5
6
7
8
9

2. Kuinka käyttää mutimodaalisia kehotteita

Tässä kuvataan, kuinka kehotemalleja käytetään mallien multimodaalisten syötteiden muotoiluun.

import base64
import httpx

image_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
image_data = base64.b64encode(httpx.get(image_url).content).decode("utf-8")

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "Describe the image provided"),
        (
            "user",
            [
                {
                    "type": "image_url",
                    "image_url": {"url": "data:image/jpeg;base64,{image_data}"},
                }
            ],
        ),
    ]
)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Voimme myös välittää mallille useita kuvia.

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "compare the two pictures provided"),
        (
            "user",
            [
                {
                    "type": "image_url",
                    "image_url": {"url": "data:image/jpeg;base64,{image_data1}"},
                },
                {
                    "type": "image_url",
                    "image_url": {"url": "data:image/jpeg;base64,{image_data2}"},
                },
            ],
        ),
    ]
)

chain = prompt | model

response = chain.invoke({"image_data1": image_data, "image_data2": image_data})
print(response.content)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

Teknologian jakaminen

LangChain - pikamalli multimodaalisille suurille malleille

Artikkelihakemisto

1. Kuinka siirtää multimodaalista dataa suoraan malliin

2. Kuinka käyttää mutimodaalisia kehotteita

henkilökohtainen profiili

yhteystietoni