Xử lý tài liệu dễ dàng hơn với API phân tích tài liệu REST và SDK Python

Trích xuất dữ liệu từ hơn 40 định dạng tài liệu phổ biến. Phân tích tài liệu bằng cách áp dụng mẫu trong quy trình hàng loạt.

  • GroupDocs.Parser Cloud for cURL
  • GroupDocs.Parser Cloud SDK for .NET
  • GroupDocs.Parser Cloud SDK for Java
  • GroupDocs.Parser Cloud SDK for PHP
  • GroupDocs.Parser Cloud SDK for Ruby
  • GroupDocs.Parser Cloud SDK for Node.js
Bắt đầu dùng thử miễn phí

GroupDocs.Parser Cloud for Python cho phép phân tích dữ liệu từ hơn 50 loại tài liệu phổ biến. Trích xuất văn bản, trích xuất hình ảnh, phân tích dữ liệu theo mẫu là những tính năng có giá trị nhất của GroupDocs.Parser và có sẵn trong dịch vụ Cloud REST API của chúng tôi. Với SDK của chúng tôi, bạn có thể giải quyết nhiều tác vụ tự động hóa xử lý tài liệu và trích xuất dữ liệu dễ dàng chỉ bằng cách áp dụng một mẫu được xác định trước. Cùng với các tài liệu thông thường, bạn có thể sử dụng các tính năng được hỗ trợ trên các tệp và vùng chứa được bảo vệ bằng mật khẩu như tệp ZIP, tệp dữ liệu thư OST/PST, sách điện tử, đánh dấu và danh mục PDF trong các ứng dụng Python của mình.

Những câu hỏi thường gặp

Tôi muốn tạo ứng dụng Python của riêng mình có thể phân tích cú pháp tệp trực tuyến?

Hãy xem Cloud SDK dành cho Python của chúng tôi tại GitHub nếu bạn đang tìm kiếm mã nguồn để phân tích cú pháp các tệp trong Cloud.

Tôi có thể dùng thử miễn phí API REST của GroupDocs.Parser trên Python không?

Bạn có thể dùng thử GroupDocs.Parser Low-Code Python API mà không có bất kỳ hạn chế nào.

Tôi không muốn tải các tập tin bí mật của mình lên bất kỳ đâu? Tôi có những lựa chọn nào?

GroupDocs.Parser Cloud cũng có sẵn dưới dạng hình ảnh Docker có thể được sử dụng để tự lưu trữ dịch vụ. Hoặc bạn có thể xây dựng dịch vụ của riêng mình bằng cách sử dụng GroupDocs.Parser High-code APIs hiện đang điều khiển cả Free Apps và REST API của chúng tôi.

Các tính năng của API REST của Document Parser

Phân tích PDF, tài liệu xử lý văn bản, bảng tính và bài thuyết trình

Phân tích các tệp mẫu Microsoft Word, Excel, PowerPoint và OpenDocument

Phân tích tài liệu và mẫu có hỗ trợ Macro cho MS Word, Excel và PowerPoint

Trích xuất nội dung văn bản từ toàn bộ tài liệu

Trích xuất văn bản và hình ảnh từ các trang cụ thể

Trích xuất văn bản đã định dạng bằng cách thiết lập chế độ trích xuất

Trích xuất văn bản từ các tài liệu trong kho lưu trữ ZIP hoặc Email

Truy xuất tài liệu từ Email, danh mục PDF và kho lưu trữ MS Outlook

Nhận số trang tài liệu và thông tin khác

Trích xuất dữ liệu từ một tài liệu bằng cách áp dụng một mẫu

GroupDocs.Parser Cloud API, cho phép trích xuất dữ liệu từ tài liệu theo mẫu. Bạn có thể xác định mẫu cho các tài liệu thông thường của mình như hóa đơn, biên lai, báo cáo và áp dụng mẫu, bạn có thể dễ dàng trích xuất dữ liệu để xử lý thêm. Ví dụ sau đây cho thấy cách trích xuất dữ liệu theo mẫu.

Trích xuất dữ liệu từ tài liệu theo mẫu - Python

# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud

app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud

parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)

options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"

request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
    ```

Extract images from Documents using GroupDocs.Parser Free App

XHTMLXLTXXLSPPTTIFFMHTMLPPSXTARXLTMPPTXXLSMJPEGPOTXDOCXOTPODTRARXLSBXLSXEPUBCSVBZ2DOCFB2ZIPONETIFTXTPNGOTSPOTMEMLXPPSMMSGGZODPDOTXJPGPPTMXLTXLAMXMLRTFPSTPPSCHMDOTGIFOSTODSJP2EMLPOTHTMLPDFDOCMBMPXLAMDDOTMOTT

Extract images from Documents using GroupDocs.Parser Free App

GZEMLTARXMLHTMLMSGPPTMDOCEMLXODSDOTXPPSMDOCMTIFGIFODTXLSZIPPPTOTSJP2CHMOSTXLTMXLAMODPPDFOTPMHTMLDOTMOTTXLSMONEPPSXPPTXDOTXLAMDPSTXLSXEPUBXLTRTFPPSBZ2JPGPNGTIFFBMPJPEGCSVPOTXDOCXRARPOTXLTXFB2XLSBXHTMLTXTPOTM

Support and Learning Resources

GroupDocs.Parser Cloud cũng cung cấp SDK phân tích tài liệu riêng cho các ngôn ngữ khác như được liệt kê bên dưới:

  Tiếng Việt