Phân tích các tài liệu như hóa đơn, biên lai hoặc bảng tài chính để trích xuất văn bản, hình ảnh và siêu dữ liệu từ hơn 40 định dạng tài liệu phổ biến.
Bắt đầu dùng thử miễn phíGroupDocs.Parser Cloud for Java là một trình bao bọc xung quanh API REST trích xuất dữ liệu tài liệu để phân tích hơn 50 loại tài liệu. Phân tích tài liệu bằng các mẫu được xác định trước là một trong những tính năng có giá trị nhất của API GroupDocs.Parser Cloud. Rất đơn giản và dễ dàng để xác định các mẫu và trích xuất dữ liệu từ hóa đơn hoặc các loại tài liệu thông thường khác. API cung cấp các phương pháp để trích xuất hình ảnh, trích xuất văn bản và siêu dữ liệu từ hầu hết các định dạng tệp phổ biến nhất. Cùng với các tài liệu thông thường, bạn có thể sử dụng các tính năng được hỗ trợ trên các tệp và vùng chứa được bảo vệ bằng mật khẩu như tệp ZIP, tệp dữ liệu thư OST/PST, sách điện tử, đánh dấu và danh mục PDF trong các ứng dụng Java của bạn.
Hãy xem Cloud SDK dành cho Java của chúng tôi tại GitHub nếu bạn đang tìm kiếm mã nguồn để phân tích cú pháp các tệp trong Cloud.
Bạn có thể dùng thử GroupDocs.Parser Low-Code Java API mà không có bất kỳ hạn chế nào.
GroupDocs.Parser Cloud cũng có sẵn dưới dạng hình ảnh Docker có thể được sử dụng để tự lưu trữ dịch vụ. Hoặc bạn có thể xây dựng dịch vụ của riêng mình bằng cách sử dụng GroupDocs.Parser High-code APIs hiện đang điều khiển cả Free Apps và REST API của chúng tôi.
GroupDocs.Parser Cloud API, cung cấp một số cách để trích xuất hình ảnh từ tài liệu. Bạn có thể trích xuất tất cả hình ảnh từ toàn bộ tài liệu, trích xuất hình ảnh từ các trang cụ thể bằng cách thiết lập phạm vi trang. Ví dụ sau đây cho thấy cách trích xuất hình ảnh từ tài liệu bên trong một container.
// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");
ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples