Anthropic은 최근 Claude 3.5 Sonnet 모델이 PDF 파일 처리 기능을 추가했으며 현재 공개 베타 단계에 들어갔다고 발표했습니다. 이 기능을 통해 사용자는 이미지, 차트 및 테이블을 포함하여 PDF 문서에서 텍스트 및 시각적 요소를 분석 할 수 있습니다. 이 움직임은 Claude의 기능을 더욱 확장하여 사용자에게 더 강력한 문서 처리 기능을 제공하고 작업 효율성을 향상시킵니다.
최근 인공 지능 회사 인 Anthropic은 Claude 3.5 Sonnet 모델에 PDF 파일 처리 기능을 추가했으며 현재 공개 테스트 단계에 들어갔다고 발표했습니다. 사용자는 이제 모델을 사용하여 재무 보고서, 법률 문서 및 문서 번역과 같은 다양한 시나리오를 위해 이미지, 차트 및 테이블을 포함한 PDF 문서에서 텍스트 및 시각적 요소를 분석 할 수 있습니다.
Claude 3.5 Sonnet의 PDF 처리 프로세스는 세 단계로 나뉩니다. 먼저 시스템은 문서에서 텍스트 내용을 추출합니다. 그런 다음 문서의 각 페이지는보다 심층적 인 분석을 위해 이미지로 변환됩니다. 이를 통해 사용자는 텍스트 정보를 얻을뿐만 아니라 PDF 파일의 시각적 정보에 대한 통찰력을 얻을 수 있습니다.
Claude의 PDF 기능은 특정 정보 추출 및 공구 입력으로 사용하는 것과 같은 다른 기능과 함께 사용할 수 있습니다. 업로드 된 파일은 32MB 미만이어야하며 페이지 수가 100 페이지를 초과해서는 안됩니다. 시스템은 현재 암호화 또는 암호로 보호 된 문서를 지원하지 않습니다.
PDF 파일 처리 비용은 문서의 길이와 컨텐츠 밀도에 따라 다릅니다. 일반적으로 페이지 당 1,500 ~ 3,000 개의 토큰은 표준 토큰 수수료를 초과하는 추가 요금없이 소비됩니다. 사용자는 Claude Chat 기능 미리보기 및 API 액세스를 통해이 새로운 기능을 사용할 수 있습니다. 여기에는 API 요청에서 특정 요청 헤더 "Anthropic-Beta : PDFS-2024-09-25"를 사용해야합니다. 이 기능을 향후 Amazon Bedrock 및 Google Vertex AI 플랫폼으로 확장 할 예정입니다.
처리를 개선하기 위해 Anthropic은 사용자가 문서에 명확하고 읽을 수있는 텍스트가 있고 페이지 레이아웃이 올바른지 확인할 것을 권장합니다. 또한 특정 콘텐츠를 인용 할 때 사용자는 PDF 리더에 표시된 페이지 번호를 사용해야합니다. API 사용 중에 PDF 파일은 텍스트 전에 배치해야합니다. 문서가 더 크고 한계를 초과하는 경우, 안트로 픽은 더 작은 섹션으로 분할 할 것을 권장합니다. 마지막으로 동일한 문서를 여러 번 분석 할 때 사용자는 프롬프트 캐시를 사용하여 처리 효율성을 향상시키는 것을 고려할 수도 있습니다.
핵심 사항 :
Anthropic은 Claude 3.5 Sonnet을 시작하여 PDF 파일 처리 기능을 추가하여 텍스트 및 이미지 분석을 지원합니다.
처리 프로세스는 텍스트 추출, 페이지 변환 및 포괄적 인 분석의 세 단계로 나뉩니다.
처리 비용은 문서 길이 및 컨텐츠 밀도에 따라 다르며 사용자는 파일 크기 및 페이지 제한이 적용됩니다.
Claude 3.5 Sonnet의 PDF 처리 기능은 사용자에게 효율적이고 편리한 문서 분석 솔루션을 제공합니다.