Phân tích tài liệu và trích xuất dữ liệu bằng cURL

Phân tích định dạng PDF và tệp từ Word, Excel, Web, Sách điện tử, Email, tệp ZIP để trích xuất văn bản, hình ảnh và siêu dữ liệu bằng REST API.

  • GroupDocs.Parser Cloud SDK for .NET
  • GroupDocs.Parser Cloud SDK for Java
  • GroupDocs.Parser Cloud SDK for PHP
  • GroupDocs.Parser Cloud SDK for Python
  • GroupDocs.Parser Cloud SDK for Ruby
  • GroupDocs.Parser Cloud SDK for Node.js
Bắt đầu dùng thử miễn phí

GroupDocs.Parser Cloud for cURL cho phép phân tích cú pháp và trích xuất dữ liệu cho hầu hết các định dạng tài liệu kinh doanh phổ biến. Sử dụng các lệnh cURL đơn giản; văn bản và hình ảnh có thể được trích xuất từ toàn bộ tài liệu hoặc từ phạm vi trang cụ thể. REST API cũng hỗ trợ các kho lưu trữ như ZIP để phân tích cú pháp và trích xuất hình ảnh, thông tin tài liệu và thông tin chi tiết về các mục chứa.

Các tính năng của API REST của Document Parser

Phân tích PDF, tài liệu xử lý văn bản, bảng tính và bài thuyết trình

Phân tích các tệp mẫu Microsoft Word, Excel, PowerPoint và OpenDocument

Phân tích tài liệu và mẫu có hỗ trợ Macro cho MS Word, Excel và PowerPoint

Trích xuất nội dung văn bản từ toàn bộ tài liệu

Trích xuất văn bản và hình ảnh từ các trang cụ thể

Trích xuất văn bản đã định dạng bằng cách thiết lập chế độ trích xuất

Trích xuất văn bản từ các tài liệu trong kho lưu trữ ZIP hoặc Email

Truy xuất tài liệu từ Email, danh mục PDF và kho lưu trữ MS Outlook

Nhận số trang tài liệu và thông tin khác

Trích xuất văn bản từ một tài liệu

Sử dụng GroupDocs.Parser Cloud API, bạn có thể nhanh chóng trích xuất hình ảnh, văn bản và siêu dữ liệu từ tài liệu được lưu trữ trên Cloud. Lệnh cURL đơn giản sau đây sẽ chỉ cho bạn cách trích xuất văn bản từ tài liệu.

Phân tích tài liệu MS Word để trích xuất văn bản - cURL

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer TOKEN-HERE" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"foldername/document.docx\", }}"

Extract images from Documents using GroupDocs.Parser Free App

OSTEMLXMLXLSMOTPDOTMMSGDOCXLACHMXLSXXLAMODPFB2TARRAREMLXXLTMPPTMPPTDOTXHTMLXLTXOTSPPTXPOTPPSMPPSXPOTXXLTCSVGIFJPGTIFJPEGJP2ODSMHTMLDOCXXLSOTTPSTPOTMXHTMLRTFZIPPNGODTDOCMXLSBEPUBBZ2BMPPPSDOTONEGZTIFFTXTMDPDF

Extract images from Documents using GroupDocs.Parser Free App

RTFPPTMXLSBTXTTARODSEMLDOTMOTTPPSMPOTXGZOTPPDFXLAMMSGMHTMLXLSMXLTPPSMDPPSXXLTXODPODTBZ2CHMCSVJP2PPTXBMPDOTXEPUBTIFFRARXLSFB2HTMLPOTMONEXHTMLDOTDOCMDOCXGIFXLTMJPGZIPPPTXMLTIFOSTPNGPSTOTSDOCJPEGPOTXLSXEMLXXLA

Support and Learning Resources

GroupDocs.Parser Cloud cũng cung cấp SDK phân tích tài liệu riêng cho các ngôn ngữ khác như được liệt kê bên dưới:

  Tiếng Việt