[02월 09일] Contour Detect

February 9, 2023 최대 1 분 소요

Contour-Detection

어제 cv2.imshow() 자체가 계속 에러가 나서 실패했었는데, 찾아보니 자세한 이유는 모르겠지만 matplotlib을 이용해서 이미지를 출력하면 되었다.

성공을 하고 예시로 피피티를 넣어보았다.
ppx -> 사이트를 이용해서 jpg로 변경 -> Coutour 찾기

결과 ⏬

성능 자체는 나쁘지 않은데 문제는 이거를 어떻게 분리해서(x, y 좌표를 어떻게 알아내서) 어떻게 json 파일로 만들어야되는지도 문제다….

따라서 이미지 자체를 분리해주는 api를 찾아보기로 했다.

Vision API 자체는 이정도 성능? 얘는 기존의 API를 사용한 것이기 때문에 json 형태로 전달도 가능하다. 하지만 문제는 여기서 어떻게 문서의 구조를 알아내냐,,,, 가 문제다
즉 얘가 header인지 본문인지 등등을 알아내는게 문제?

그래서 PDF-Structure 관련해서 검색해보기로 했다.

✅ Contour-Detection -> PDF에서 이미지 추출 검색
✅ Vision API -> Vision API + python extract pdf structure 검색