Skip to content

Vision의 새로운 기능 #40

@kimscastle

Description

@kimscastle

Vision의 새로운 기능

Text인식

VNRecognizeTextRequestRevision3를 통한 세 번째 수정본
더 좋은 성능의 Live Text 기능 가능, 다양한 언어의 지원(한국어지원)
스크린샷 2022-08-25 오전 9 31 55

어떤언어인지를 자동으로 판단하게 해주는 프로퍼티 존재
-> 하지만 아직 정확도가 엄청 높지 않기때문에 "내가 어떤언어인지 모르는상황"에서만 부분적으로 사용하길 권장
스크린샷 2022-08-25 오전 9 35 00

바코드감지

VNDetectBarcodesRequestRevision3를 통한 세 번째 수정본
이 수정 버전은 이전 수정 버전에서 벗어나 작동 원리로 현대 머신 러닝을 이용함
스크린샷 2022-08-25 오전 9 36 26

한 이미지에서 하나가 아닌 다양한 코드를 감지
일부 코드에 대해서 경계 상자도 개선
곡선 표현과 굴절 같이 과거에 감지 정확도를 방해했던 인공물을 더 잘 무시합니다
스크린샷 2022-08-25 오전 9 40 38

최선버전의 모델을 사용하기를 권장
기존버전으로 바코드가 두개인곳을 인식하려하면 이상한 곳을 감지함
스크린샷 2022-08-25 오전 9 50 53

최신버전을 이용하면 바코드를 따로따로 잘 인식하는걸 확인가능
스크린샷 2022-08-25 오전 9 51 36

광류감지

광류는 두 개의 연속 이미지를 분석
광류 분석으로 모션의 방향이나 벡터의 크기 추정이 가능
스크린샷 2022-08-25 오전 9 41 30

두 이미지를 보면 왼쪽사진이 과거 오른쪽사진이 한프레임 미래라는걸 알 수 있음
스크린샷 2022-08-25 오전 9 42 50

광류감지를 통해 모션이 발견된 곳을 찾아낼 수있게된다
스크린샷 2022-08-25 오전 9 43 43

왼쪽이 버전1 오른쪽이 버전2인데 움직이는 물병이 훨씬더 선명하게 보인다는걸 알 수 있다
스크린샷 2022-08-25 오전 9 45 55

꼬리도 버전2에서 더 선명하고 길게 보인다는걸 확인할 수 있다
스크린샷 2022-08-25 오전 9 47 06

Quick Look Preview 지원

결과값을 중간에 쉽게 디버깅을 통해 확인할 수 있다
스크린샷 2022-08-25 오전 9 56 24

스크린샷 2022-08-25 오전 9 58 31

Metadata

Metadata

Assignees

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions