[02월 09일] Contour Detect
Contour-Detection
어제 cv2.imshow()
자체가 계속 에러가 나서 실패했었는데, 찾아보니 자세한 이유는 모르겠지만 matplotlib을 이용해서 이미지를 출력하면 되었다.
성공을 하고 예시로 피피티를 넣어보았다.
ppx -> 사이트를 이용해서 jpg로 변경 -> Coutour 찾기
결과 ⏬
성능 자체는 나쁘지 않은데 문제는 이거를 어떻게 분리해서(x, y 좌표를 어떻게 알아내서) 어떻게 json 파일로 만들어야되는지도 문제다….
따라서 이미지 자체를 분리해주는 api를 찾아보기로 했다.
Vision API
Vision API 자체는 이정도 성능? 얘는 기존의 API를 사용한 것이기 때문에 json 형태로 전달도 가능하다. 하지만 문제는 여기서 어떻게 문서의 구조를 알아내냐,,,, 가 문제다
즉 얘가 header인지 본문인지 등등을 알아내는게 문제?
그래서 PDF-Structure 관련해서 검색해보기로 했다.
SOL
✅ Contour-Detection -> PDF에서 이미지 추출
검색
✅ Vision API -> Vision API + python extract pdf structure
검색
python extract pdf structure
등등 다양하게 검색을 해보았지만 일단은 fitz 패키지를 사용해서 이미지 추출, text 추출, 표 추출까지는 성공을 했는데
- 페이지별 텍스트와 이미지는 어떻게 넣을 것인지
- 문서 구조는 어떻게 나눠야 되는 것인지
❗내일 여기부터❗
를 좀더 찾아봐야겠다,,,
오늘까지 정리
- pdf에서 바로 텍스트 추출 가능
- pdf에서 이미지는 추출이 가능 <-> ❓단: 쓸모없는 이미지들까지 저장이 됨.
- pdf에서 표까지 추출 가능 -> ❓얘를 어떻게 구성할 껀데?
댓글남기기