2024년 12월 18일 FORCE Motive Power 컨퍼런스에서 Volcano Engine은 빈백 대형 모델 제품군의 포괄적인 업그레이드를 출시했습니다. 가장 눈길을 끄는 것은 새로운 시각적 이해 모델의 출시입니다. 텍스트와 이미지의 동시 입력을 지원하고, 인식, 이해, 추론 능력이 더욱 강화되었으며, 매우 경쟁력 있는 가격으로 사용자에게 서비스를 제공하는 모델입니다. 이번 업그레이드는 다양한 분야에서 Beanbao 대형 모델의 적용 기능을 향상시킬 뿐만 아니라 시각적 이해 기술이 새로운 개발 단계에 진입했음을 의미하며 기업과 개발자에게 더욱 편리하고 효율적인 AI 솔루션을 제공합니다.
2024년 12월 18일 Volcano Engine FORCE Motive Power 컨퍼런스에서 Volcano Engine은 빈백 대형 모델 제품군의 포괄적인 업그레이드를 발표하고 새로운 시각적 이해 모델을 출시했습니다.

Volcano Engine의 Tan Dai 사장은 Doubao 모델 토큰의 일일 평균 사용량이 지난 몇 달 동안 급격히 증가하여 5월 출시에 비해 33배 증가한 4조 이상에 이르렀다고 말했습니다. 이러한 증가 추세는 여러 애플리케이션 시나리오에서 대규모 빈백 모델이 널리 사용됨을 보여줍니다.

이번에 볼케이노 엔진은 사용자가 텍스트와 이미지 질문을 동시에 입력할 수 있는 시각적 이해 모델을 출시했으며, 모델은 포괄적으로 이해하고 정확한 답변을 제공할 수 있습니다. 이 혁신은 애플리케이션 개발 프로세스를 크게 단순화하고 더 많은 시나리오에서 대형 모델의 잠재력을 활성화합니다.
시각적 이해 모델은 이미지의 객체 카테고리 및 모양과 같은 기본 요소를 식별할 수 있을 뿐만 아니라 객체 간의 관계, 공간 레이아웃 및 장면의 전반적인 의미를 이해할 수 있는 강력한 콘텐츠 인식 기능을 갖추고 있습니다. 예를 들어 그림자 식별, 자연 지식 식별 등이 있습니다.

시각적 이해 모델은 더 강력한 이해 및 추론 기능을 갖추고 있어 콘텐츠를 더 잘 식별할 수 있을 뿐만 아니라 인식된 텍스트 및 이미지 정보를 기반으로 그래픽 추론, 물리적 추론 등 복잡한 논리적 계산을 수행할 수도 있습니다.

또한, 이미지 정보를 바탕으로 이미지의 내용을 더욱 자세하게 기술할 수 있는 보다 섬세한 시각적 묘사 능력도 갖추고 있으며, 이미지 창작, 이미지 시 창작 등 다양한 문학적 스타일을 만들어 낼 수도 있다.

Doubao의 시각적 이해 모델은 교육, 관광, 전자상거래 등 다양한 분야에서 폭넓은 응용 가능성을 보여줍니다. 예를 들어, 교육 분야에서는 학생들이 관광 분야에서 자신의 구성과 대중 과학 지식을 최적화하는 데 도움을 줄 수 있고, 전자 상거래 마케팅 분야에서는 관광객에게 외국 메뉴 번역과 건축 배경 지식 설명을 제공할 수 있습니다. 제품의 특징을 자세히 설명하여 광고 효과를 향상시킵니다.
시각적 이해 모델을 사용하는 비용도 매우 저렴합니다. 토큰 1,000개당 가격은 0.003위안으로 업계 평균 가격보다 85% 저렴합니다. 이 가격 수준을 통해 1달러는 최대 284개의 720P 이미지를 처리할 수 있으며, 이는 시각적 이해 기술이 "센티 시대"로 진입했음을 의미합니다. 또한 Volcano Engine은 기업과 개발자가 이 기술을 더 잘 활용할 수 있도록 최대 15,000개의 초기 트래픽 지원을 제공합니다.

이번 컨퍼런스에서 Volcano Engine은 시각적 이해 모델을 출시했을 뿐만 아니라 다른 여러 모델도 업그레이드했습니다. Doubao Universal Model Pro의 종합적인 작업 처리 능력은 5월에 비해 32% 증가했으며, 추론, 지시 따르기, 코딩, 수학 등의 영역에서도 상당한 개선이 있었습니다. 동시에 빈백과 영상생성 모델은 2025년 1월 일반에 공개될 예정이며, 기업은 예약을 통해 이용할 수 있다.


기업의 정보 획득 및 검색 추천 기능을 향상시키기 위해 Volcano Engine은 기업이 정보와 사용자 요구를 더 잘 연결하고 다양한 산업의 지능적 변혁을 촉진할 수 있도록 글로벌 AI 검색 서비스도 출시했습니다.
가장 밝은 부분:
Doubao Big Model의 일일 평균 토큰 사용량은 4조에 이르렀으며, 이는 5월에 비해 33배 증가한 수치입니다.
새롭게 출시된 시각적 이해 모델은 텍스트와 이미지 동시 입력을 지원해 교육, 관광, 전자상거래 등 분야에 적합하다.
1,000개 토큰당 사용 비용은 0.003위안에 불과하며 이는 업계 평균 가격보다 현저히 낮습니다.
요컨대, 볼케이노엔진이 이번에 출시한 대형 콩주머니 모델 업그레이드와 새로운 시각적 이해 모델은 인공지능 분야의 지속적인 혁신과 사용자 요구에 대한 깊은 이해를 보여주며 다양한 산업의 지능적 변혁을 위한 강력한 기술 지원을 제공한다.