"An end-to-end trainable scene text localization and recognition framework"
해야할 것
기본 OCR 성능 테스트
OCR 추가 공부
Large-scale Street View Text with Partial Labeling 결과 분석
3/24
Video Meeting
Research 가 아닌 실제 활용 가능한 Application 을 만들 수 있도록
이번주는 어떤 것들이 이번 분야에서 가져다가 쓸만한지
데일리 미팅 아침 9시
Project Schedule
Supervised by : Byungsoo Kim, Taegyu Lim, Brian Sohn (한국계 미국인)
크게 세가지 파트
Part 1 : OCR recognition
구역 글자(ex: A2)를 검출하는 것
텍스트를 인지
Part 2 : Corner Detection
코너의 꼭지점을 정확히 알아내는 것
잘 안된다면 검은색 테두리 등을 추가하는 방안도 있음
Part 3 : 6 DoF
실제 위치 계산 cam <-> marker
Retrieval algorithm 을 강화
이후 MotionKit 에 올리기.
Bryan 미팅
알고리즘 및 Visualization
Condition
For any general fonts
조사
Camera Calibration
실제 세계는 3차원 -> 카메라는 2차원
영상좌표에서 공간좌표를 복원하기 위해 카메라 내부 요인을 제거하는 것
탐지 순서 방안
전체 OCR -> Corner Detection
cv를 통한 전처리 필요
속도가 빠름
OCR 성능이 사진 전체에서 찾을 수 있을만큼 좋은가?
멀리있을때도 찾을 수 있을까?
Detection 으로 text plate 탐색 -> 2. 구역 내에서 OCR (Text) -> 3. Corner Detection
속도가 느릴 수 있음
Detection
cv를 사용한 전처리 후 CNN으로 Object Detection
또는 cv 만으로 detection
4시 임태규 박사님 미팅
4시반 미팅
전처리
Histogram Equalization
Hsv 색상 필터링
OCR
optical character recognition
Text-Localization -> Word Recognition -> End to End
- 이미지 이진화 : Adaptive thresholding
- Image Blurring, Image Dilation
- 문서가 아닌 Natural Image 에서 Detection 하기 위해서는?
- - Text-Localization 필요
- 제한되지 않은 환경에서 Text Reading
- - ICDAR 2019 Robust Reading Chanllenge
- [https://rrc.cvc.uab.es](https://rrc.cvc.uab.es)
- 데이터셋, 논문 찾기