Nhận diện văn bản

- Dữ liệu gửi lên là hình của bài báo được truyền qua trường file
- Loại file hỗ trợ 'bmp', 'png', 'jpg', 'jpeg', 'tif', 'tiff', 'PNG'

Đường dẫn: POST https://ai.vhv.vn/viai/vision/ocr/textRegconize

Cấu trúc headers

Tham số	Mô tả
Authorization	Bearer Token
Content-Type	application/json

Cấu trúc body

Tham số	Kiểu dữ liệu	Bắt buộc	Mô tả
name	String		Tên file
path	String		Đường dẫn tới file

Kết quả trả về

Tham số

Kiểu dữ liệu

Mô tả

Integer

Chỉ mục của đầu vào được khai báo dùng để phân biệt kết quả OCR của các trang của file pdf hoặc hình ảnh của file tff, với input đầu vào chỉ có 1 ảnh sẽ mặc định là 1

position

Array

Chứa đựng vị trí của từng từ, mỗi từ gồm các trường (x,y,w,h (bouding box của từ) trong đó tọa độ x y của điểm bên trái trên cùng và w h là chiều rộng và chiều cao của bouding box), word (nội dung)

textline

Array

Chứa đựng vị trí của 1 textline, mỗi từ gồm các trường (x,y,w,h (bouding box của từ) trong đó tọa độ x y của điểm bên trái trên cùng và w h là chiều rộng và chiều cao của bouding box), text (nội dung)

Mô tả kết quả

Kết quả là các trường dữ liệu chứa:
+ Chỉ mục của đầu vào được khai báo dùng để phân biệt kết quả OCR của các trang của file pdf hoặc hình ảnh của file tff, với input đầu vào chỉ có 1 ảnh sẽ mặc định là 1
+ Chứa đựng vị trí của từng từ, mỗi từ gồm các trường (x,y,w,h (bouding box của từ) trong đó tọa độ x y của điểm bên trái trên cùng và w h là chiều rộng và chiều cao của bouding box), word (nội dung)
+ Chứa đựng vị trí của 1 textline, mỗi từ gồm các trường (x,y,w,h (bouding box của từ) trong đó tọa độ x y của điểm bên trái trên cùng và w h là chiều rộng và chiều cao của bouding box), text (nội dung)