Phân tích & Trích xuất bằng REST API & Java SDK

Phân tích các tài liệu như hóa đơn, biên lai hoặc bảng tài chính để trích xuất văn bản, hình ảnh và siêu dữ liệu từ hơn 40 định dạng tài liệu phổ biến.

  • GroupDocs.Parser Cloud for cURL
  • GroupDocs.Parser Cloud SDK for .NET
  • GroupDocs.Parser Cloud SDK for PHP
  • GroupDocs.Parser Cloud SDK for Python
  • GroupDocs.Parser Cloud SDK for Ruby
  • GroupDocs.Parser Cloud SDK for Node.js
Bắt đầu dùng thử miễn phí

GroupDocs.Parser Cloud for Java là một trình bao bọc xung quanh API REST trích xuất dữ liệu tài liệu để phân tích hơn 50 loại tài liệu. Phân tích tài liệu bằng các mẫu được xác định trước là một trong những tính năng có giá trị nhất của API GroupDocs.Parser Cloud. Rất đơn giản và dễ dàng để xác định các mẫu và trích xuất dữ liệu từ hóa đơn hoặc các loại tài liệu thông thường khác. API cung cấp các phương pháp để trích xuất hình ảnh, trích xuất văn bản và siêu dữ liệu từ hầu hết các định dạng tệp phổ biến nhất. Cùng với các tài liệu thông thường, bạn có thể sử dụng các tính năng được hỗ trợ trên các tệp và vùng chứa được bảo vệ bằng mật khẩu như tệp ZIP, tệp dữ liệu thư OST/PST, sách điện tử, đánh dấu và danh mục PDF trong các ứng dụng Java của bạn.

Những câu hỏi thường gặp

Tôi muốn tạo ứng dụng Java của riêng mình có thể phân tích cú pháp tệp trực tuyến?

Hãy xem Cloud SDK dành cho Java của chúng tôi tại GitHub nếu bạn đang tìm kiếm mã nguồn để phân tích cú pháp các tệp trong Cloud.

Tôi có thể dùng thử API REST của GroupDocs.Parser trên Java miễn phí không?

Bạn có thể dùng thử GroupDocs.Parser Low-Code Java API mà không có bất kỳ hạn chế nào.

Tôi không muốn tải các tập tin bí mật của mình lên bất kỳ đâu? Tôi có những lựa chọn nào?

GroupDocs.Parser Cloud cũng có sẵn dưới dạng hình ảnh Docker có thể được sử dụng để tự lưu trữ dịch vụ. Hoặc bạn có thể xây dựng dịch vụ của riêng mình bằng cách sử dụng GroupDocs.Parser High-code APIs hiện đang điều khiển cả Free Apps và REST API của chúng tôi.

Các tính năng của API REST của Document Parser

Phân tích PDF, tài liệu xử lý văn bản, bảng tính và bài thuyết trình

Phân tích các tệp mẫu Microsoft Word, Excel, PowerPoint và OpenDocument

Phân tích tài liệu và mẫu có hỗ trợ Macro cho MS Word, Excel và PowerPoint

Trích xuất nội dung văn bản từ toàn bộ tài liệu

Trích xuất văn bản và hình ảnh từ các trang cụ thể

Trích xuất văn bản đã định dạng bằng cách thiết lập chế độ trích xuất

Trích xuất văn bản từ các tài liệu trong kho lưu trữ ZIP hoặc Email

Truy xuất tài liệu từ Email, danh mục PDF và kho lưu trữ MS Outlook

Nhận số trang tài liệu và thông tin khác

Trích xuất hình ảnh từ một tài liệu

GroupDocs.Parser Cloud API, cung cấp một số cách để trích xuất hình ảnh từ tài liệu. Bạn có thể trích xuất tất cả hình ảnh từ toàn bộ tài liệu, trích xuất hình ảnh từ các trang cụ thể bằng cách thiết lập phạm vi trang. Ví dụ sau đây cho thấy cách trích xuất hình ảnh từ tài liệu bên trong một container.

Trích xuất hình ảnh từ PDF Portfolio - Java

// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";

Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);

FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");

ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");

ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);

ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);

// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples

Extract images from Documents using GroupDocs.Parser Free App

DOTDOTMODPXLTXTIFXLSPDFEMLDOTXOTSPSTPPSPOTXMSGTARCSVRARBZ2GIFPOTMDHTMLMHTMLOSTJP2BMPEPUBDOCXONEXLSMGZXLTXLAPPTPPTMPNGPPTXZIPXHTMLXLAMJPEGDOCMXLSBEMLXXLTMPOTMFB2ODTXMLPPSMODSOTPDOCRTFCHMTIFFOTTJPGTXTPPSXXLSX

Extract images from Documents using GroupDocs.Parser Free App

PPSXDOTXMSGEMLMDXLAMTXTRARRTFTIFCHMXMLZIPBZ2XLSXPPSJPEGGIFODTODPJP2XLSPOTMDOCPPTMOTSDOTMGZJPGEMLXPOTXDOCMTARDOCXFB2ONEPPTXLAEPUBXLTBMPOTPPSTPPSMXLSBMHTMLPDFOSTCSVXHTMLHTMLPOTTIFFPPTXOTTXLSMXLTMDOTPNGODSXLTX

Support and Learning Resources

GroupDocs.Parser Cloud cũng cung cấp SDK phân tích tài liệu riêng cho các ngôn ngữ khác như được liệt kê bên dưới:

  Tiếng Việt