Logo
  • Đăng nhập|
  • Đăng ký
  • Trang chủ
  • Giới thiệu
  • Tin tức
  • Đăng nhập
  • Đăng ký
    • API AI_VHV
      • Chuyển ảnh chứa văn bản về dạng word
      • Chuyển pdf về dạng text
      • Chuyển pdf về dạng word
      • Nhận diện văn bản
      • Sửa lỗi chính tả tiếng việt
      • Trích xuất thông tin thẻ đảng viên
      • Chuyển pdf về dạng word ver2
      • Chuyển pdf về dạng text ver 2
      • Trích xuất văn bằng chứng chỉ
      • Trích xuất căn cước công dân
      • Trích xuất bảng từ PDF sang Excel
      • Lấy thông tin thẻ Đảng
      • Text to speech
      • Chat With Bot
      • Chat Bot Training
      • Tạo câu hỏi tự động từ đoạn text
      • Lấy thông tin từ ảnh cho App
      • Scan đề thi
      • EKYC
      • VBCC
      • SerialNumber
      • Chatbot wiki
      • Chatbot VGPT
      • Chatbot NLU
      • Chatbot TTHC Hải Dương
      • Chatbot Bitel
      • Xóa lịch sử chatbot người dùng Bitel
      • ExtractVbcc
      • Quản lý Key AI
      • Lấy nội dung text từ file
      • Convert dữ liệu file sang text
      • Giọng đọc ViettetlAI

Nhận diện văn bản

- Dữ liệu gửi lên là hình của bài báo được truyền qua trường file
- Loại file hỗ trợ 'bmp', 'png', 'jpg', 'jpeg', 'tif', 'tiff', 'PNG'

Đường dẫn: POST https://ai.vhv.vn/viai/vision/ocr/textRegconize

Cấu trúc headers

Tham số Mô tả
Authorization Bearer Token
Content-Type

application/json

Cấu trúc body

Tham số Kiểu dữ liệu Bắt buộc Mô tả
name
String

Tên file

path
String

Đường dẫn tới file

Kết quả trả về

Tham số Kiểu dữ liệu Mô tả
id Integer
Chỉ mục của đầu vào được khai báo dùng để phân biệt kết quả OCR của các trang của file pdf hoặc hình ảnh của file tff, với input đầu vào chỉ có 1 ảnh sẽ mặc định là 1
position Array
Chứa đựng vị trí của từng từ, mỗi từ gồm các trường (x,y,w,h (bouding box của từ) trong đó tọa độ x y của điểm bên trái trên cùng và w h là chiều rộng và chiều cao của bouding box), word (nội dung)
textline Array
Chứa đựng vị trí của 1 textline, mỗi từ gồm các trường (x,y,w,h (bouding box của từ) trong đó tọa độ x y của điểm bên trái trên cùng và w h là chiều rộng và chiều cao của bouding box), text (nội dung)

Mô tả kết quả

Kết quả là các trường dữ liệu chứa: 
+ Chỉ mục của đầu vào được khai báo dùng để phân biệt kết quả OCR của các trang của file pdf hoặc hình ảnh của file tff, với input đầu vào chỉ có 1 ảnh sẽ mặc định là 1
+ Chứa đựng vị trí của từng từ, mỗi từ gồm các trường (x,y,w,h (bouding box của từ) trong đó tọa độ x y của điểm bên trái trên cùng và w h là chiều rộng và chiều cao của bouding box), word (nội dung)
+ Chứa đựng vị trí của 1 textline, mỗi từ gồm các trường (x,y,w,h (bouding box của từ) trong đó tọa độ x y của điểm bên trái trên cùng và w h là chiều rộng và chiều cao của bouding box), text (nội dung)