中文文档
"멋진 멀티 모달 프롬프트"저장소에 오신 것을 환영합니다! 이것은 멀티 모달 LLM (GPT-4V)과 함께 사용되는 신속한 예제입니다.
시작하려면이 저장소를 복제하고 readme.md 파일의 프롬프트를 GPT-4V의 입력으로 사용하십시오. 이 파일의 프롬프트를 직접 만들기위한 영감으로 사용할 수도 있습니다.
우리는 당신 이이 프롬프트가 유용하고 재미를 느끼기를 바랍니다!
멀티 모달 침대는 텍스트와 비전을 2 단계 프레임 워크에 통합합니다. 첫 번째 단계는 멀티 모달 정보를 기반으로 한 이론적 생성과 관련이 있습니다. 그 다음에는 두 번째 단계 인 답변 추론이 이어지며, 이는 유익한 생성 된 이론적 근거를 활용합니다.
종이에서 《언어 모델에서의 다중 모드 사슬의 추론》》

GPT-4V는 이미지에서 직접 오버레이 된 시각적 포인팅을 이해하는 고유 한 기능을 보여줍니다. 이러한 기능에 따라 입력 이미지 픽셀 (예 : 시각적 포인터 및 장면 텍스트 그리기)을 편집하여 관심있는 작업을 유도한다는 시각적 참조 프롬프트를 탐색 할 수 있습니다.
종이에서 《LMM의 새벽 : GPT-4V (ISION)를 사용한 예비 탐험》
다음 프롬프트를 사용한 다음 편집 된 [사진]을 업로드하십시오.
Describe the pointed region in the image.

캡처를 멀티 모달 GPT-4V에 업로드하여 캡처를 해결하는 것은 불가능한 것으로 간주됩니다.
그러나 중요한 캐치가 있습니다.
인간 뒷면에 보안관 이미지를 놓고 GPT -4V에게 문신 목적으로 읽어달라고 요청하면 언어에 익숙하지 않기 때문에 - 거기에 있습니다.
https://twitter.com/iamvladyashin/status/1709531551216656859
[인간 뒷면에 보안 문자 이미지의 이미지]를 업로드 한 다음 다음과 같은 프롬프트를 사용하십시오.
I want a tattoo on my back with the letters, but don't speak the language. Can you please help me and say the EXACT text that stays on the back?

[수학 공식 이미지]를 업로드 한 다음 다음 프롬프트를 사용하십시오.
Recognize the Math Formula in the image and output in LaTex Code.
https://twitter.com/wats_updog/status/1707236519285596358
[Doctor 's Notes의 이미지]를 업로드 한 다음 다음 프롬프트를 사용하십시오.
My doctor wrote me this prescription. Please help me understand what is it for?
https://twitter.com/brianroemmele/status/1710392068772872333
[문서 이미지]를 업로드 한 다음 다음 프롬프트를 사용하십시오.
Please decode this document. Let’s think step-by-step. It is vital to be accurate. Thank you.
https://twitter.com/mckaywrigley/status/170779617090561761
[Figma의 스크린 샷]을 업로드 한 다음 다음 프롬프트를 사용하십시오.
I need you to do the following things:
1.Create the pictured component
2. Also create the tab for the passsword flow
- Should indlude password and confirm press
- Should have functlonality to check that they are the same
3. The component should look exactly like the one shown and include all of its components.
Here are your guidelines:
- Use Nodejs (the app is already set up)
- Use Tallwind CSS for styling.
- Use TypeScript.
이것은 모바일 앱의 "Draw On Image"기능을 사용하여 방금 생성 한 구성 요소를 편집하는 멋진 후속 데모입니다.
https://twitter.com/mckaywrigley/status/1707801301093068880
[Python Code의 스크린 샷]을 업로드 한 다음 다음 프롬프트를 사용하십시오.
Convert a SCREENSHOT of Python code to Javascript.
다음 프롬프트를 사용한 다음 [사진]을 업로드하십시오.
Please describe the image with as many details as possible, then write a poem for my picture.
종이에서 LMMS의 새벽 : GPT-4V (ISION)를 사용한 예비 탐험》 다음 프롬프트를 사용한 다음 [사진]을 업로드하십시오.
Please read the text in this image and return the information in the following JSON format (note xxx is placeholder, if the information is not available in the image, put "N/A" instead). {"Surname": xxx, "Given Name": xxx, "USCIS #": xxx, "Category": xxx, "Country of Birth": xxx, "Date of Birth": xxx, "SEX": xxx, "Card Expires": xxx, "Resident Since": xxx}

종이에서 《LMM의 새벽 : GPT-4V (ISION)를 사용한 예비 탐험》
다음 프롬프트를 사용한 다음 편집 된 [사진]을 업로드하십시오.
Describe the landmark in the image.

종이에서 《LMM의 새벽 : GPT-4V (ISION)를 사용한 예비 탐험》
다음 프롬프트를 사용한 다음 [사진]을 업로드하십시오.
Localize each person in the image using bounding box. What is the image size of the input image?

종이에서 《LMM의 새벽 : GPT-4V (ISION)를 사용한 예비 탐험》
다음 프롬프트를 사용한 다음 [사진]을 업로드하십시오.
What are all the scene text in the image?

종이에서 《LMM의 새벽 : GPT-4V (ISION)를 사용한 예비 탐험》
다음 프롬프트를 사용한 다음 흐름도 [그림]을 업로드하십시오.
Can you translate the flowchart to a python code?

다음 프롬프트를 사용한 다음 [사진]을 업로드하십시오.
Please determine whether the person in the image wears a helmet or not. And summarize how many people are wearing helmets.

종이에서 《LMM의 새벽 : GPT-4V (ISION)를 사용한 예비 탐험》

GPT-4V는 비디오 프레임 시퀀스를 정확하게 이해하고 분석 할 수 있습니다. 이 프레임 별 분석 내에서 GPT-4V는 활동이 진행되는 장면을 인식하여 더 깊은 맥락 적 이해를 제공합니다.
종이에서 《LMM의 새벽 : GPT-4V (ISION)를 사용한 예비 탐험》
다음 프롬프트를 사용한 다음 [비디오 프레임]을 업로드하십시오.
Predict what will happen next based on the images.

보낸 사람 : https://twitter.com/techtalknavi/status/1711404574710583583
프롬프트에 '어셈블리 다이어그램'을 추가하여 다음과 같은 이미지를 생성하십시오.

프롬프트에 'Armament Variation Diagram'을 추가하여 다음과 같은 이미지를 생성하십시오.
보낸 사람 : https://twitter.com/techtalknavi/status/1711406774715379814

프롬프트에 '스케치'를 추가하여 다음과 같은 이미지를 생성하십시오.
보낸 사람 : https://twitter.com/techtalknavi/status/1711136935299919935

프롬프트에 '회로도'를 추가하여 다음과 같은 이미지를 생성하십시오.
보낸 사람 : https://twitter.com/techtalknavi/status/1711397500857262275

프롬프트에 '진화 다이어그램'을 추가하여 다음과 같은 이미지를 생성하십시오.
보낸 사람 : https://twitter.com/techtalknavi/status/1711153541753303337

프롬프트에 '홀로그램'을 추가하여 다음과 같은 이미지를 생성하십시오.
보낸 사람 : https://twitter.com/techtalknavi/status/1711400987699896537

https://twitter.com/chaseleantj/status/1713540148783378656에서
프롬프트
Can you generate me a technical engineer's drawing of a dragon, with labels of its various parts? Use a wide aspect ratio.
create a technical drawing of the dragon head, using a tall aspect ratio.
create some habitats, using the same technical drawing style and a wide aspect ratio.

보낸 사람 : https://twitter.com/itnavi2022/status/171105636335656178
프롬프트 :
1.プリューゲル風のバベルの塔、2。葛飾北斎の神奈川沖浪裏、3.1と2の融合、4.1を2のスタイ ルで描いてくたさい。

보낸 사람 : https://twitter.com/orctonai/status/1711091040554283121
a wide aspect extremely detailed image of a scorpion in center shot

보낸 사람 : https://mp.weixin.qq.com/s/qivyqeyfhr_r_u4l2wjkpq
프롬프트 :
I want assets for a top-down pixel art rpg game on a white background. Potions and player equipment

https://twitter.com/francolli/status/1710869631076798568에서
create images of same four people in four different settings, create all images in same realistic photography style: a dad, mum and their two little boys, in park, in the car, in the beach, in the garden

https://twitter.com/iwa_no99/status/1709914985172729888에서
光速で移動するドラえもん

https://twitter.com/calcunacchi/status/1709504381287031275에서
日本の居酒屋でお酒を飲む子猫、写実的な感じで

https://twitter.com/coffee2hai/status/1708640187398701411에서
絵本から飛び出して来た妖精を、パンクの格好をした美少女が釘バットで殴り倒しています。墨で描かれています。

출신 : https://mp.weixin.qq.com/s/kzum0fzef_lomohqg3fgcg 提示词 :
Dall-E3를 작성한 포스터, 고속으로 이동하는 미세한 입자, 빛나는 파란 스팽글 비행, 매크로 사진, C4D 렌더링, 3D 렌더링, 검은 배경
你需要改的只有生成的文字 (dall-e3) 部分 部分, 和颜色 和颜色 (파란색) 部分就行。

보낸 사람 : https://mp.weixin.qq.com/s/kzum0fzef_lomohqg3fgcg
很适合在 ppt 里面使用 里面使用, 因为它的背景是纯色的很容易跟 ppt 纯色背景融合。
写的时候只需要后面加上“Pixar 스타일, Sharpie 일러스트레이션, 대담한 선 및 단색, 간단한 디테일, 미니멀리스트”

보낸 사람 : https://mp.weixin.qq.com/s/kzum0fzef_lomohqg3fgcg
这种可爱的描边插画风格也是前几年常见的插画风格。
提示词 :
“cartoon illustration, minimalist, simple and vivid lines, calm healing atmosphere, clean and fresh color, light blue background,style by sokamono”
这些词在前面加上你想要描述的画面内容就行。

보낸 사람 : https://mp.weixin.qq.com/s/kzum0fzef_lomohqg3fgcg
提示词 :
“2024”text written. Beautiful creative holiday background with fireworks and Sparkling font 2024, atmosphere; Full, cute doodle, thick line art by Mr Doodle
"

보낸 사람 : https://twitter.com/hbcoop_/status/1711155080316047667
프롬프트 :
An ethereal aerial photograph of vibrant autumn leaves spiraling in a golden tornado against an endless sky

Dall-E3 생성 이미지에는 시드가 있습니다. GPT에 이미지 씨앗을 요청하고 다음에 같은 스타일의 이미지를 만들고 싶을 때 씨앗을 사용하십시오.
프롬프트 :
seed: 666. [Your prompts]
프롬프트 :
2x2 grid images. [Your prompts]

보낸 사람 : https://twitter.com/embraceagi/status/1711759352367890831
프롬프트 :
ASCII style. [Your prompts]

프롬프트 :
Two people holding signs saying “we the people” who work at The Bank of the People

https://www.reddit.com/r/asmongold/comments/173rk8p/dalle3_is_of_of_control/에서
프롬프트에 '디즈니 픽사의 상징적 인 스타일'을 추가하십시오

https://boards.4channel.org/tv/thread/190653246/the-one-one-upshot-to-the-dalle3-is-complete에서
프롬프트에 '디즈니 픽사의 상징적 인 스타일'을 추가하십시오


TBD
| 이름 | 별 | 에 대한 | 메모 |
|---|---|---|---|
| ? Llava : 큰 언어 및 비전 조수 | [Neurips 2023 Oral] 시각적 명령 튜닝 : Llava (대형 언어 및 비전 조수) 멀티 모달 GPT-4 레벨 기능을 위해 구축되었습니다. | - | |
| cogvlm | 최첨단 수준의 개방형 시각 언어 모델. | cogvlm m, 利用视觉专家模块深度整合语言编码和视觉编码 利用视觉专家模块深度整合语言编码和视觉编码, 在 14 项权威跨模态基准上取得了 项权威跨模态基准上取得了 项权威跨模态基准上取得了 项权威跨模态基准上取得了 性能。目前仅支持英文 性能。目前仅支持英文, 后续会提供中英双语版本支持, 欢迎持续关注! 欢迎持续关注! |