이 페이지는 Pipeline Builder를 사용하여 PDF를 분석하여 시맨틱 검색을 위한 기본 가이드를 제공하며, Workshop 앱에서 정보를 제시하는 권장 사항을 포함합니다.
시맨틱 검색은 PDF와 함께 사용할 때 매우 강력한 도구이며, 특히 콘텐츠가 별도로 내장된 더 작은 "청크"로 분해되면 사용자와 워크플로가 다른 방법으로 접근하기 어려운 중요한 정보를 찾는 데 도움이 됩니다. 이는 PDF에 종종 간과되는 대량의 비구조화된 지식이 있을 때 특히 유용합니다.
사용하려면, Foundry에 PDF를 업로드하고, 텍스트를 추출하고, 동일한 텍스트를 청크로 나누고, 그 청크를 검색하고, 사용자를 위한 출처 cross-validation을 위해 해당 PDF를 렌더링하여 검색 결과를 표면화합니다.
PDF를 가져오고 PDF의 컨텐츠를 표면화하기 위한 시맨틱 검색을 설정하려면 아래에 기술된 단계를 따르십시오 :