Trích xuất dữ liệu từ hơn 40 định dạng tài liệu phổ biến. Phân tích tài liệu bằng cách áp dụng mẫu trong quy trình hàng loạt.
Bắt đầu dùng thử miễn phíGroupDocs.Parser Cloud for Python cho phép phân tích dữ liệu từ hơn 50 loại tài liệu phổ biến. Trích xuất văn bản, trích xuất hình ảnh, phân tích dữ liệu theo mẫu là những tính năng có giá trị nhất của GroupDocs.Parser và có sẵn trong dịch vụ Cloud REST API của chúng tôi. Với SDK của chúng tôi, bạn có thể giải quyết nhiều tác vụ tự động hóa xử lý tài liệu và trích xuất dữ liệu dễ dàng chỉ bằng cách áp dụng một mẫu được xác định trước. Cùng với các tài liệu thông thường, bạn có thể sử dụng các tính năng được hỗ trợ trên các tệp và vùng chứa được bảo vệ bằng mật khẩu như tệp ZIP, tệp dữ liệu thư OST/PST, sách điện tử, đánh dấu và danh mục PDF trong các ứng dụng Python của mình.
Hãy xem Cloud SDK dành cho Python của chúng tôi tại GitHub nếu bạn đang tìm kiếm mã nguồn để phân tích cú pháp các tệp trong Cloud.
Bạn có thể dùng thử GroupDocs.Parser Low-Code Python API mà không có bất kỳ hạn chế nào.
GroupDocs.Parser Cloud cũng có sẵn dưới dạng hình ảnh Docker có thể được sử dụng để tự lưu trữ dịch vụ. Hoặc bạn có thể xây dựng dịch vụ của riêng mình bằng cách sử dụng GroupDocs.Parser High-code APIs hiện đang điều khiển cả Free Apps và REST API của chúng tôi.
GroupDocs.Parser Cloud API, cho phép trích xuất dữ liệu từ tài liệu theo mẫu. Bạn có thể xác định mẫu cho các tài liệu thông thường của mình như hóa đơn, biên lai, báo cáo và áp dụng mẫu, bạn có thể dễ dàng trích xuất dữ liệu để xử lý thêm. Ví dụ sau đây cho thấy cách trích xuất dữ liệu theo mẫu.
# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud
app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)
options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"
request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
```