본문 바로가기
Web 3.0/AI

이미지와 텍스트 인식 AI 서비스

by Pstor 2022. 1. 13.

인공지능을 공부하면서 이러한 기술을 어디에 사용하면 좋을까를 많이 고민했다. 처음에는 취약점 분석 혹은 포렌식에 사용하고 싶었지만, 요즘은 이미지 분석과 텍스트 인식에 더 많은 관심이 생긴다. 하지만 요즘 핸드폰만 봐도 이미지 인식 기술은 정말 많이 좋아졌다. (TMI 인공지능 처음 배울 때 이미지 처리부터 배웠다... 바둑판 같은 곳에 빗금 그어가며….)

 

Vision AI는 인식과 생성의 두 가지 방향으로 발전하고 있습니다. 오늘 작성할 글은 인식 인공지능이며 나중에 코드를 작성해서 어느 정도 완성이 되면 제 Github에 올려 두겠습니다. 이렇게 오픈 소스로 올리는 이유는 개인적인 바람으로는 이러한 기술들이 사회에서 좋은 방향으로 사용되었으면 합니다. 개인적으로 데이터를 모으는 용도가 아닌 힘든 사람들 글을 찾아내서 삭제 혹은 청소년에게 유해한 게시물을 예방 할 수 있을 거라고 생각합니다.

 

 

1. 객체 인식

- 개체 인식 AI는 이미지 혹은 비디오 상의 객체를 식별하는 컴퓨터 비전 기술이다. 객체 인식은 딥러닝과 머신러닝의 알고리즘을 통해 산출 되는 중요한 기술이다.

 

2. 인물 인식

- 인물 인식 인공지능은 이미지 혹은 영상에 있는 사람을 인식한뒤 이미지 안에 얼굴이 존재 하는지 누구인지 등을 인식 합니다.

 

3. 얼굴 인식 (안면 인식)

- 얼굴 인식 인공지능은 정해진 거리에서 적절한 조명과 카메라를 바라보고 찍은 이미지를 데이터베이스에 저장해서 사용합니다. 하지만 얼굴 인식 프로그램은 좋은 기술임에도 불구하고 사생활 문제 때문에 양날의 검으로 불리고 있습니다. 사실 모든 신기술은 언제나 양날의 검입니다.

 

4. 글자인식

- 글자 인식 인공지능 (OCR)은 드라마 스타트업을 봤다면 알고 있을 만한 기술입니다. 드라마 스타트업에서는 필체 인식 인공지능을 만드는 것으로 나오는데요. OCR 인공지능은 여러 방면에서 사용되고 있습니다. 네이버에서도 이미 서비스가 진행되고 있고 공공, 의료, 금융, IT 등 많은 곳에서 활용이 되고 있습니다.

 

 

오늘은 기본적인 내용과 제가 앞으로 저 네가지를 융합 하여 좋은 인공지능 프로그램을 만들고 싶습니다. 다음 글에서는 제가 작성하는 코드와 기술 내용 그리고 연구 방향에 대해 올리도록 하겠습니다. 개인적으로 이러한 기술들이 많이 발전해서 사회에서 좋은 방향으로 사용 되었으면 합니다.

반응형