UNPKG

tencentcloud-sdk-nodejs

Version:
966 lines (864 loc) 61.2 kB
import { AbstractClient } from "../../../common/abstract_client"; import { ClientConfig } from "../../../common/interface"; import { RecognizeOnlineTaxiItineraryOCRResponse, HKIDCardOCRRequest, BankSlipOCRRequest, BusinessCardOCRResponse, BankCardOCRRequest, SmartStructuralOCRResponse, CarInvoiceOCRRequest, RecognizeTravelCardOCRRequest, TrainTicketOCRRequest, EstateCertOCRResponse, FlightInvoiceOCRRequest, MLIDPassportOCRRequest, RecognizeGeneralTextImageWarnResponse, SmartStructuralOCRV2Request, TextDetectResponse, TollInvoiceOCRResponse, GetOCRTokenResponse, FinanBillSliceOCRResponse, DriverLicenseOCRResponse, WaybillOCRResponse, ClassifyStoreNameRequest, InvoiceGeneralOCRRequest, QuestionSplitOCRRequest, HmtResidentPermitOCRResponse, EnterpriseLicenseOCRResponse, QuestionOCRResponse, InstitutionOCRResponse, DriverLicenseOCRRequest, SmartStructuralProRequest, RecognizeTableOCRResponse, QrcodeOCRResponse, MainlandPermitOCRRequest, SmartStructuralOCRV2Response, EnterpriseLicenseOCRRequest, QuestionSplitOCRResponse, TableOCRResponse, RecognizeStoreNameRequest, PropOwnerCertOCRResponse, TrainTicketOCRResponse, RecognizeFormulaOCRResponse, ArithmeticOCRResponse, FormulaOCRResponse, RecognizeGeneralCardWarnRequest, RecognizeEncryptedIDCardOCRRequest, SmartStructuralOCRRequest, GeneralHandwritingOCRRequest, BizLicenseOCRRequest, MixedInvoiceDetectResponse, RideHailingDriverLicenseOCRRequest, GeneralAccurateOCRResponse, QrcodeOCRRequest, TaxiInvoiceOCRResponse, RecognizeGeneralInvoiceRequest, GeneralBasicOCRResponse, RecognizeMedicalInvoiceOCRResponse, RecognizeValidIDCardOCRRequest, MixedInvoiceOCRResponse, ClassifyDetectOCRResponse, VinOCRRequest, VehicleLicenseOCRResponse, VatInvoiceOCRRequest, ClassifyDetectOCRRequest, DutyPaidProofOCRResponse, TollInvoiceOCRRequest, LicensePlateOCRResponse, HKIDCardOCRResponse, RecognizeThaiIDCardOCRResponse, OrgCodeCertOCRResponse, PermitOCRRequest, InvoiceGeneralOCRResponse, VatInvoiceVerifyNewResponse, TaxiInvoiceOCRRequest, RecognizeContainerOCRRequest, TextDetectRequest, VatRollInvoiceOCRResponse, EduPaperOCRResponse, RecognizeThaiIDCardOCRRequest, PropOwnerCertOCRRequest, ImageEnhancementResponse, PassportOCRResponse, VehicleRegCertOCRRequest, RecognizeTravelCardOCRResponse, LicensePlateOCRRequest, GeneralBasicOCRRequest, GeneralEfficientOCRRequest, AdvertiseOCRRequest, RideHailingDriverLicenseOCRResponse, ImageEnhancementRequest, EnglishOCRRequest, RecognizeValidIDCardOCRResponse, IDCardOCRResponse, GeneralAccurateOCRRequest, OrgCodeCertOCRRequest, RecognizeFormulaOCRRequest, FlightInvoiceOCRResponse, VatInvoiceVerifyNewRequest, InstitutionOCRRequest, ArithmeticOCRRequest, VerifyOfdVatInvoiceOCRRequest, FinanBillSliceOCRRequest, RecognizeGeneralCardWarnResponse, ClassifyStoreNameResponse, VatRollInvoiceOCRRequest, RecognizeTableAccurateOCRRequest, SealOCRResponse, FinanBillOCRResponse, RecognizeHealthCodeOCRRequest, BankSlipOCRResponse, RecognizeEncryptedIDCardOCRResponse, VinOCRResponse, EduPaperOCRRequest, FormulaOCRRequest, PassportOCRRequest, DutyPaidProofOCRRequest, RecognizeHealthCodeOCRResponse, MixedInvoiceOCRRequest, ResidenceBookletOCRResponse, CarInvoiceOCRResponse, VehicleRegCertOCRResponse, GeneralFastOCRRequest, ShipInvoiceOCRResponse, RecognizeGeneralInvoiceResponse, QuestionOCRRequest, RecognizeMedicalInvoiceOCRRequest, InsuranceBillOCRResponse, GeneralEfficientOCRResponse, ShipInvoiceOCRRequest, MLIDPassportOCRResponse, SealOCRRequest, VerifyOfdVatInvoiceOCRResponse, HmtResidentPermitOCRRequest, RecognizeTableAccurateOCRResponse, ResidenceBookletOCRRequest, GetOCRResultRequest, BusInvoiceOCRResponse, GetOCRResultResponse, MainlandPermitOCRResponse, MLIDCardOCRRequest, EnglishOCRResponse, RecognizeForeignPermanentResidentIdCardResponse, BusInvoiceOCRRequest, QuotaInvoiceOCRResponse, RideHailingTransportLicenseOCRResponse, RecognizeContainerOCRResponse, SmartStructuralProResponse, PermitOCRResponse, InsuranceBillOCRRequest, GeneralHandwritingOCRResponse, AdvertiseOCRResponse, VehicleLicenseOCRRequest, RecognizeOnlineTaxiItineraryOCRRequest, IDCardOCRRequest, MixedInvoiceDetectRequest, WaybillOCRRequest, RecognizeStoreNameResponse, GetOCRTokenRequest, RideHailingTransportLicenseOCRRequest, MLIDCardOCRResponse, RecognizeTableOCRRequest, EstateCertOCRRequest, BizLicenseOCRResponse, VatInvoiceOCRResponse, QuotaInvoiceOCRRequest, BankCardOCRResponse, TableOCRRequest, BusinessCardOCRRequest, FinanBillOCRRequest, RecognizeGeneralTextImageWarnRequest, RecognizeForeignPermanentResidentIdCardRequest, GeneralFastOCRResponse } from "./ocr_models"; /** * ocr client * @class */ export declare class Client extends AbstractClient { constructor(clientConfig: ClientConfig); /** * 本接口支持病案首页、费用清单、结算单、医疗发票四种保险理赔单据的文本识别和结构化输出。 默认接口请求频率限制:1次/秒。 */ InsuranceBillOCR(req: InsuranceBillOCRRequest, cb?: (error: string, rep: InsuranceBillOCRResponse) => void): Promise<InsuranceBillOCRResponse>; /** * 文本图像增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度。 默认接口请求频率限制:10次/秒。 */ ImageEnhancement(req: ImageEnhancementRequest, cb?: (error: string, rep: ImageEnhancementResponse) => void): Promise<ImageEnhancementResponse>; /** * 试卷切题识别可将整页练习册、试卷或教辅中的题目进行自动切题,并识别出其中的文字内容和坐标位置。 默认接口请求频率限制:2次/秒。 */ QuestionSplitOCR(req: QuestionSplitOCRRequest, cb?: (error: string, rep: QuestionSplitOCRResponse) => void): Promise<QuestionSplitOCRResponse>; /** * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。 默认接口请求频率限制:5次/秒。 */ SmartStructuralOCRV2(req: SmartStructuralOCRV2Request, cb?: (error: string, rep: SmartStructuralOCRV2Response) => void): Promise<SmartStructuralOCRV2Response>; /** * 本接口支持智能化识别各类企业登记证书、许可证书、企业执照、三证合一类证书,结构化输出统一社会信用代码、公司名称、法定代表人、公司地址、注册资金、企业类型、经营范围、成立日期、有效期、开办资金、经费来源、举办单位等关键字段。 默认接口请求频率限制:5次/秒。 */ EnterpriseLicenseOCR(req: EnterpriseLicenseOCRRequest, cb?: (error: string, rep: EnterpriseLicenseOCRResponse) => void): Promise<EnterpriseLicenseOCRResponse>; /** * 本接口支持中英文名片各字段的自动定位与识别,包含姓名、电话、手机号、邮箱、公司、部门、职位、网址、地址、QQ、微信、MSN等。 默认接口请求频率限制:10次/秒。 */ BusinessCardOCR(req: BusinessCardOCRRequest, cb?: (error: string, rep: BusinessCardOCRResponse) => void): Promise<BusinessCardOCRResponse>; /** * 本接口支持网约车行程单关键字段的识别,包括行程起止日期、上车时间、起点、终点、里程、金额等字段。 默认接口请求频率限制:20次/秒。 */ RecognizeOnlineTaxiItineraryOCR(req: RecognizeOnlineTaxiItineraryOCRRequest, cb?: (error: string, rep: RecognizeOnlineTaxiItineraryOCRResponse) => void): Promise<RecognizeOnlineTaxiItineraryOCRResponse>; /** * 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。 另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备8种告警功能,如下表所示。 <table style="width:650px"> <thead> <tr> <th width="150">扩展能力</th> <th width="500">能力项</th> </tr> </thead> <tbody> <tr> <td rowspan="2">裁剪功能</td> <td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td> </tr> <tr> <td>人像照片裁剪(自动抠取身份证头像区域)</td> </tr> <tr> <td rowspan="9">告警功能</td> <td>身份证有效日期不合法,即有效日期不符合5年、10年、20年、长期期限 </td> </tr> <tr> <td>身份证边框不完整告警</td> </tr> <tr> <td>身份证复印件告警</td> </tr> <tr> <td>身份证翻拍告警</td> </tr> <tr> <td>身份证框内遮挡告警</td> </tr> <tr> <td>临时身份证告警</td> </tr> <tr> <td>身份证疑似存在PS痕迹告警</td> </tr> <tr> <td>图片模糊告警(可根据图片质量分数判断)</td> </tr> </tbody> </table> 默认接口请求频率限制:20次/秒。 */ IDCardOCR(req: IDCardOCRRequest, cb?: (error: string, rep: IDCardOCRResponse) => void): Promise<IDCardOCRResponse>; /** * 本接口支持过路过桥费发票关键字段的识别,包括发票代码、发票号码、日期、金额、入口、出口、时间、发票消费类型、高速标志等。 默认接口请求频率限制:5次/秒。 */ TollInvoiceOCR(req: TollInvoiceOCRRequest, cb?: (error: string, rep: TollInvoiceOCRResponse) => void): Promise<TollInvoiceOCRResponse>; /** * 本接口支持马来西亚身份证识别,识别字段包括身份证号、姓名、性别、地址;具备身份证人像照片的裁剪功能和翻拍、复印件告警功能。 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect) */ MLIDCardOCR(req: MLIDCardOCRRequest, cb?: (error: string, rep: MLIDCardOCRResponse) => void): Promise<MLIDCardOCRResponse>; /** * 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票、通用机打电子发票(广东和浙江)。 默认接口请求频率限制:20次/秒。 */ VatInvoiceVerifyNew(req: VatInvoiceVerifyNewRequest, cb?: (error: string, rep: VatInvoiceVerifyNewResponse) => void): Promise<VatInvoiceVerifyNewResponse>; /** * 本接口支持条形码和二维码的识别(包括 DataMatrix 和 PDF417)。 默认接口请求频率限制:5次/秒。 */ QrcodeOCR(req: QrcodeOCRRequest, cb?: (error: string, rep: QrcodeOCRResponse) => void): Promise<QrcodeOCRResponse>; /** * 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。 适用于文字较多、版式复杂、对识别准召率要求较高的场景,如试卷试题、网络图片、街景店招牌、法律卷宗等场景。 产品优势:与通用印刷体识别接口相比,本接口提供更高精度的通用文字识别服务,在手写体、文字较多、长串数字、小字、模糊字、倾斜文本等困难场景下,高精度版的准确率和召回率更高。 通用文字识别不同版本的差异如下: <table style="width:715px"> <thead> <tr> <th style="width:150px"></th> <th >【荐】通用印刷体识别(高精度版)</th> <th style="width:200px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th> <th><a href="https://cloud.tencent.com/document/product/866/37831">通用印刷体识别(精简版)</a></th> </tr> </thead> <tbody> <tr> <td> 适用场景</td> <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td> <td>适用于所有通用场景的印刷体识别</td> <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td> </tr> <tr> <td>识别准确率</td> <td>99%</td> <td>96%</td> <td>91%</td> </tr> <tr> <td>价格</td> <td></td> <td></td> <td></td> </tr> <tr> <td>支持的语言</td> <td>中文、英文、中英文</td> <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td> <td>中文、英文、中英文</td> </tr> <tr> <td>自动语言检测</td> <td>支持</td> <td>支持</td> <td>支持</td> </tr> <tr> <td>返回文本行坐标</td> <td>支持</td> <td>支持</td> <td>支持</td> </tr> <tr> <td>自动旋转纠正</td> <td>支持旋转识别,返回角度信息</td> <td>支持旋转识别,返回角度信息</td> <td>支持旋转识别,返回角度信息</td> </tr> </tbody> </table> 默认接口请求频率限制:10次/秒。 */ GeneralAccurateOCR(req: GeneralAccurateOCRRequest, cb?: (error: string, rep: GeneralAccurateOCRResponse) => void): Promise<GeneralAccurateOCRResponse>; /** * 本接口支持机票行程单关键字段的识别,包括旅客姓名、有效身份证件号码、电子客票号码、验证码、填开单位、其他税费、燃油附加费、民航发展基金、保险费、销售单位代号、始发地、目的地、航班号、时间、日期、座位等级、承运人、发票消费类型、票价、合计金额、填开日期、国内国际标签、印刷序号、客票级别/类别、客票生效日期、有效期截止日期、免费行李等字段,支持航班信息多行明细输出。 默认接口请求频率限制:5次/秒。 */ FlightInvoiceOCR(req: FlightInvoiceOCRRequest, cb?: (error: string, rep: FlightInvoiceOCRResponse) => void): Promise<FlightInvoiceOCRResponse>; /** * 本接口支持集装箱箱门信息识别,识别字段包括集装箱箱号、类型、总重量、有效承重、容量、自身重量,具备集装箱箱号、类型不完整或者不清晰的告警功能。 默认接口请求频率限制:5次/秒。 */ RecognizeContainerOCR(req: RecognizeContainerOCRRequest, cb?: (error: string, rep: RecognizeContainerOCRResponse) => void): Promise<RecognizeContainerOCRResponse>; /** * 本接口支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。识别效果比表格识别V2更好,覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)的识别效果均优于表格识别V2。 默认接口请求频率限制:2次/秒。 */ RecognizeTableAccurateOCR(req: RecognizeTableAccurateOCRRequest, cb?: (error: string, rep: RecognizeTableAccurateOCRResponse) => void): Promise<RecognizeTableAccurateOCRResponse>; /** * 身份证识别(安全加密版)接口实现了数据加密传输,能够有效防止个人身份证隐私信息不被窃取泄露。 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。 另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备9种告警功能,如下表所示。 <table style="width:650px"> <thead> <tr> <th width="150">扩展能力</th> <th width="500">能力项</th> </tr> </thead> <tbody> <tr> <td rowspan="2">裁剪功能</td> <td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td> </tr> <tr> <td>人像照片裁剪(自动抠取身份证头像区域)</td> </tr> <tr> <td rowspan="9">告警功能</td> <td>身份证有效日期不合法,即有效日期不符合5年、10年、20年、长期期限 </td> </tr> <tr> <td>身份证边框不完整告警</td> </tr> <tr> <td>身份证复印件告警</td> </tr> <tr> <td>身份证翻拍告警</td> </tr> <tr> <td>身份证框内遮挡告警</td> </tr> <tr> <td>临时身份证告警</td> </tr> <tr> <td>身份证疑似存在PS痕迹告警</td> </tr> <tr> <td>图片模糊告警(可根据图片质量分数判断)</td> </tr> </tbody> </table> 默认接口请求频率限制:20次/秒。 */ RecognizeEncryptedIDCardOCR(req: RecognizeEncryptedIDCardOCRRequest, cb?: (error: string, rep: RecognizeEncryptedIDCardOCRResponse) => void): Promise<RecognizeEncryptedIDCardOCRResponse>; /** * 本接口支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。 默认接口请求频率限制:5次/秒。 */ MixedInvoiceDetect(req: MixedInvoiceDetectRequest, cb?: (error: string, rep: MixedInvoiceDetectResponse) => void): Promise<MixedInvoiceDetectResponse>; /** * 本接口支持国内机动车登记证书主要字段的结构化识别,包括机动车所有人、身份证明名称、号码、车辆型号、车辆识别代号、发动机号、制造厂名称等。 默认接口请求频率限制:5次/秒。 */ VehicleRegCertOCR(req: VehicleRegCertOCRRequest, cb?: (error: string, rep: VehicleRegCertOCRResponse) => void): Promise<VehicleRegCertOCRResponse>; /** * 本接口支持识别轮船票的发票代码、发票号码、日期、姓名、票价、始发地、目的地、姓名、时间、发票消费类型、省、市、币种字段。 默认接口请求频率限制:5次/秒。 */ ShipInvoiceOCR(req: ShipInvoiceOCRRequest, cb?: (error: string, rep: ShipInvoiceOCRResponse) => void): Promise<ShipInvoiceOCRResponse>; /** * 本接口用于识别门头照文字识别结果以及对应分类标签信息 默认接口请求频率限制:1次/秒 */ RecognizeStoreName(req: RecognizeStoreNameRequest, cb?: (error: string, rep: RecognizeStoreNameResponse) => void): Promise<RecognizeStoreNameResponse>; /** * 本接口支持以及其他国家、地区的护照识别。识别字段包括护照ID、姓名、出生日期、性别、有效期、发行国、国籍、国家地区代码,具备护照人像照片的裁剪功能和翻拍、复印件告警功能。 本接口支持地区范围:可机读护照国家。包括中国港澳台地区、新加坡、马来西亚、泰国、美国、韩国、越南、澳大利亚、缅甸、印度尼西亚、日本、加拿大、老挝、巴基斯坦、哈萨克斯坦、法国、英国、德国、菲律宾、新西兰、印度、意大利、蒙古、孟加拉国、尼日利亚、柬埔寨、西班牙、摩洛哥、吉尔吉斯斯坦、埃及、荷兰、塔吉克斯坦、巴西、乌兹别克斯坦、伊拉克、阿尔及利亚、土耳其、南非、墨西哥、尼泊尔、白俄罗斯、叶门、阿富汗、沙特、肯尼亚、波兰、比利时、瑞典、奥地利、坦桑尼亚、委内瑞拉、阿根廷、喀麦隆、斯里兰卡、衣索比亚、约旦、瑞士、加纳、爱尔兰、哥伦比亚、苏丹、匈牙利、罗马尼亚、阿联酋、文莱、希腊、以色列、巴拿马、丹麦、伊朗、乌干达、挪威、秘鲁、葡萄牙、智利、塞尔维亚、芬兰、尚比亚、亚美尼亚、叙利亚、黎巴嫩、斯洛伐克、卡塔尔、古巴、朝鲜。 默认接口请求频率限制:5次/秒。 */ MLIDPassportOCR(req: MLIDPassportOCRRequest, cb?: (error: string, rep: MLIDPassportOCRResponse) => void): Promise<MLIDPassportOCRResponse>; /** * 本接口支持对增值税发票(卷票)关键字段的识别,包括的发票代码、合计金额(小写)、合计金额(大写)、开票日期、发票号码、购买方识别号、销售方识别号、校验码、销售方名称、购买方名称、发票消费类型、省、市、是否有公司印章、单价、金额、数量、服务类型、品名、种类等。 默认接口请求频率限制:5次/秒。 */ VatRollInvoiceOCR(req: VatRollInvoiceOCRRequest, cb?: (error: string, rep: VatRollInvoiceOCRResponse) => void): Promise<VatRollInvoiceOCRResponse>; /** * 本接口支持定额发票的发票号码、发票代码、金额(大小写)、发票消费类型、地区及是否有公司印章等关键字段的识别。 默认接口请求频率限制:5次/秒。 */ QuotaInvoiceOCR(req: QuotaInvoiceOCRRequest, cb?: (error: string, rep: QuotaInvoiceOCRResponse) => void): Promise<QuotaInvoiceOCRResponse>; /** * 本接口支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。 默认接口请求频率限制:10次/秒。 */ WaybillOCR(req: WaybillOCRRequest, cb?: (error: string, rep: WaybillOCRResponse) => void): Promise<WaybillOCRResponse>; /** * 本接口支持图片内车辆识别代号(VIN)的检测和识别。 默认接口请求频率限制:10次/秒。 */ VinOCR(req: VinOCRRequest, cb?: (error: string, rep: VinOCRResponse) => void): Promise<VinOCRResponse>; /** * 本接口支持图片中整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,识别速度更快。 默认接口请求频率限制:10次/秒。 */ GeneralFastOCR(req: GeneralFastOCRRequest, cb?: (error: string, rep: GeneralFastOCRResponse) => void): Promise<GeneralFastOCRResponse>; /** * 本接口支持房产证关键字段的识别,包括房地产权利人、共有情况、登记时间、规划用途、房屋性质、房屋坐落等。 目前接口对合肥、成都、佛山三个城市的房产证版式识别较好。 默认接口请求频率限制:5次/秒。 */ PropOwnerCertOCR(req: PropOwnerCertOCRRequest, cb?: (error: string, rep: PropOwnerCertOCRResponse) => void): Promise<PropOwnerCertOCRResponse>; /** * 本接口支持智能提取各类证照、票据、表单、合同等结构化场景的key:value字段信息,并支持提取表格信息的key:value组的结构化,灵活高效,适用于各类非标准材料的信息录入场景,点击[立即体验](https://ocrdemo.cloud.tencent.com/)。 默认接口请求频率限制:5次/秒。 */ SmartStructuralPro(req: SmartStructuralProRequest, cb?: (error: string, rep: SmartStructuralProResponse) => void): Promise<SmartStructuralProResponse>; /** * 本接口支持快速精准识别营业执照上的字段,包括统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限和经营范围等字段。 默认接口请求频率限制:10次/秒。 */ BizLicenseOCR(req: BizLicenseOCRRequest, cb?: (error: string, rep: BizLicenseOCRResponse) => void): Promise<BizLicenseOCRResponse>; /** * 本接口支持图片内手写体文字的检测和识别,针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。 默认接口请求频率限制:10次/秒。 */ GeneralHandwritingOCR(req: GeneralHandwritingOCRRequest, cb?: (error: string, rep: GeneralHandwritingOCRResponse) => void): Promise<GeneralHandwritingOCRResponse>; /** * 题目识别是教育的基础OCR识别能力。可支持扫描、拍照场景的单题题目识别。接口支持印刷体文本、手写体文本及公式的OCR识别和坐标返回,此外,接口还可对题目中的配图位置进行检测并返回坐标位置。适用于智能批改等场景的题目内容识别作为检索输入。 默认接口请求频率限制:2次/秒。 */ QuestionOCR(req: QuestionOCRRequest, cb?: (error: string, rep: QuestionOCRResponse) => void): Promise<QuestionOCRResponse>; /** * 本接口支持出租车发票关键字段的识别,包括发票号码、发票代码、金额、日期、上下车时间、里程、车牌号、发票类型及所属地区等字段。 默认接口请求频率限制:5次/秒。 */ TaxiInvoiceOCR(req: TaxiInvoiceOCRRequest, cb?: (error: string, rep: TaxiInvoiceOCRResponse) => void): Promise<TaxiInvoiceOCRResponse>; /** * 本接口支持对通用机打发票的发票代码、发票号码、日期、合计金额(小写)、合计金额(大写)、购买方识别号、销售方识别号、校验码、购买方名称、销售方名称、时间、种类、发票消费类型、省、市、是否有公司印章、发票名称、购买方地址、电话、销售方地址、电话、购买方开户行及账号、销售方开户行及账号、经办人取票用户、经办人支付信息、经办人商户号、经办人订单号、货物或应税劳务、服务名称、数量、单价、税率、税额、金额、单位、规格型号、合计税额、合计金额、备注、收款人、复核、开票人、密码区、行业分类等字段的识别。 默认接口请求频率限制:5次/秒。 */ InvoiceGeneralOCR(req: InvoiceGeneralOCRRequest, cb?: (error: string, rep: InvoiceGeneralOCRResponse) => void): Promise<InvoiceGeneralOCRResponse>; /** * 医疗发票识别目前支持全国统一门诊发票、全国统一住院发票、以及部分地方的门诊和住院发票的识别。 默认接口请求频率限制:5次/秒。 */ RecognizeMedicalInvoiceOCR(req: RecognizeMedicalInvoiceOCRRequest, cb?: (error: string, rep: RecognizeMedicalInvoiceOCRResponse) => void): Promise<RecognizeMedicalInvoiceOCRResponse>; /** * 获取ocr结果 */ GetOCRResult(req: GetOCRResultRequest, cb?: (error: string, rep: GetOCRResultResponse) => void): Promise<GetOCRResultResponse>; /** * 本接口支持中国香港身份证人像面中关键字段的识别,包括中文姓名、英文姓名、姓名电码、出生日期、性别、证件符号、首次签发日期、最近领用日期、身份证号、是否是永久性居民身份证;具备人像照片裁剪等扩展功能。 默认接口请求频率限制:5次/秒。 */ HKIDCardOCR(req: HKIDCardOCRRequest, cb?: (error: string, rep: HKIDCardOCRResponse) => void): Promise<HKIDCardOCRResponse>; /** * 本接口支持中英文图片/ PDF内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。 默认接口请求频率限制:10次/秒。 */ RecognizeTableOCR(req: RecognizeTableOCRRequest, cb?: (error: string, rep: RecognizeTableOCRResponse) => void): Promise<RecognizeTableOCRResponse>; /** * 支持通用证照的有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能,支持通用证照的ps伪造检测,可以应用于各种证件信息有效性校验场景。 默认接口请求频率限制:5次/秒。 */ RecognizeGeneralCardWarn(req: RecognizeGeneralCardWarnRequest, cb?: (error: string, rep: RecognizeGeneralCardWarnResponse) => void): Promise<RecognizeGeneralCardWarnResponse>; /** * 本接口支持对完税证明的税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等关键字段的识别。 默认接口请求频率限制:5次/秒。 */ DutyPaidProofOCR(req: DutyPaidProofOCRRequest, cb?: (error: string, rep: DutyPaidProofOCRResponse) => void): Promise<DutyPaidProofOCRResponse>; /** * 本接口支持图像整体文字的检测和识别。可以识别中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语,阿拉伯语20种语言,且各种语言均支持与英文混合的文字识别。 适用于印刷文档识别、网络图片识别、广告图文字识别、街景店招牌识别、菜单识别、视频标题识别、头像文字识别等场景。 产品优势:支持自动识别语言类型,可返回文本框坐标信息,对于倾斜文本支持自动旋转纠正。 通用印刷体识别不同版本的差异如下: <table style="width:715px"> <thead> <tr> <th style="width:150px"></th> <th style="width:200px">【荐】通用印刷体识别</th> <th ><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th> <th><a href="https://cloud.tencent.com/document/product/866/37831">通用印刷体识别(精简版)</a></th> </tr> </thead> <tbody> <tr> <td> 适用场景</td> <td>适用于所有通用场景的印刷体识别</td> <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td> <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td> </tr> <tr> <td>识别准确率</td> <td>96%</td> <td>99%</td> <td>91%</td> </tr> <tr> <td>价格</td> <td></td> <td></td> <td></td> </tr> <tr> <td>支持的语言</td> <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td> <td>中文、英文、中英文</td> <td>中文、英文、中英文</td> </tr> <tr> <td>自动语言检测</td> <td>支持</td> <td>支持</td> <td>支持</td> </tr> <tr> <td>返回文本行坐标</td> <td>支持</td> <td>支持</td> <td>支持</td> </tr> <tr> <td>自动旋转纠正</td> <td>支持旋转识别,返回角度信息</td> <td>支持旋转识别,返回角度信息</td> <td>支持旋转识别,返回角度信息</td> </tr> </tbody> </table> 默认接口请求频率限制:20次/秒。 */ GeneralBasicOCR(req: GeneralBasicOCRRequest, cb?: (error: string, rep: GeneralBasicOCRResponse) => void): Promise<GeneralBasicOCRResponse>; /** * 本接口支持对卡式港澳台通行证的识别,包括签发地点、签发机关、有效期限、性别、出生日期、英文姓名、姓名、证件号等字段。 默认接口请求频率限制:10次/秒。 */ PermitOCR(req: PermitOCRRequest, cb?: (error: string, rep: PermitOCRResponse) => void): Promise<PermitOCRResponse>; /** * 本接口支持组织机构代码证关键字段的识别,包括代码、有效期、地址、机构名称等。 默认接口请求频率限制:5次/秒。 */ OrgCodeCertOCR(req: OrgCodeCertOCRRequest, cb?: (error: string, rep: OrgCodeCertOCRResponse) => void): Promise<OrgCodeCertOCRResponse>; /** * 本接口通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。 默认接口请求频率限制:5次/秒。 */ TextDetect(req: TextDetectRequest, cb?: (error: string, rep: TextDetectResponse) => void): Promise<TextDetectResponse>; /** * 本接口支持常见银行票据的自动分类和识别。切片识别包括金融行业常见票据的重要切片字段识别,包括金额、账号、日期、凭证号码等。(金融票据切片:金融票据中待识别字段及其周围局部区域的裁剪图像。) 默认接口请求频率限制:5次/秒。 */ FinanBillSliceOCR(req: FinanBillSliceOCRRequest, cb?: (error: string, rep: FinanBillSliceOCRResponse) => void): Promise<FinanBillSliceOCRResponse>; /** * 本接口支持识别公路汽车客票关键字段的识别,包括发票代码、发票号码、日期、票价、始发地、目的地、姓名、时间、发票消费类型、身份证号、省、市、开票日期、乘车地点、检票口、客票类型、车型、座位号、车次等。 默认接口请求频率限制:5次/秒。 */ BusInvoiceOCR(req: BusInvoiceOCRRequest, cb?: (error: string, rep: BusInvoiceOCRResponse) => void): Promise<BusInvoiceOCRResponse>; /** * <b>此接口为表格识别的旧版本服务,不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/49525">新版表格识别</a></b> 本接口支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。 默认接口请求频率限制:10次/秒。 */ TableOCR(req: TableOCRRequest, cb?: (error: string, rep: TableOCRResponse) => void): Promise<TableOCRResponse>; /** * 本接口支持增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通发票)、电子发票(增值税专用发票)全字段的内容检测和识别,包括发票代码、发票号码、打印发票代码、打印发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方识别号、复核、销售方识别号、开票人、密码区1、密码区2、密码区3、密码区4、发票名称、购买方名称、销售方名称、服务名称、备注、规格型号、数量、单价、金额、税额、收款人等字段,点击[立即试用](https://cloud.tencent.com/product/ocr)。 默认接口请求频率限制:10次/秒。 */ VatInvoiceOCR(req: VatInvoiceOCRRequest, cb?: (error: string, rep: VatInvoiceOCRResponse) => void): Promise<VatInvoiceOCRResponse>; /** * 外国人永久居留身份证识别 */ RecognizeForeignPermanentResidentIdCard(req: RecognizeForeignPermanentResidentIdCardRequest, cb?: (error: string, rep: RecognizeForeignPermanentResidentIdCardResponse) => void): Promise<RecognizeForeignPermanentResidentIdCardResponse>; /** * 本接口支持网约车驾驶证关键字段的识别,包括姓名、证号、起始日期、截止日期、发证日期。 默认接口请求频率限制:5次/秒。 */ RideHailingDriverLicenseOCR(req: RideHailingDriverLicenseOCRRequest, cb?: (error: string, rep: RideHailingDriverLicenseOCRResponse) => void): Promise<RideHailingDriverLicenseOCRResponse>; /** * 港澳台居住证OCR支持港澳台居住证正反面全字段内容检测识别功能,包括姓名、性别、出生日期、地址、身份证号、签发机关、有效期限、签发次数、通行证号码关键字段识别。可以应用于港澳台居住证信息识别场景,例如银行开户、用户注册等。 默认接口请求频率限制:20次/秒。 */ HmtResidentPermitOCR(req: HmtResidentPermitOCRRequest, cb?: (error: string, rep: HmtResidentPermitOCRResponse) => void): Promise<HmtResidentPermitOCRResponse>; /** * 本接口支持多种类型证件有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能。可以应用于各种证件信息有效性校验场景,例如银行开户、用户注册等场景。 */ RecognizeGeneralTextImageWarn(req: RecognizeGeneralTextImageWarnRequest, cb?: (error: string, rep: RecognizeGeneralTextImageWarnResponse) => void): Promise<RecognizeGeneralTextImageWarnResponse>; /** * 本接口支持识别并提取各类证照、票据、表单、合同等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。 默认接口请求频率限制:5次/秒。 */ SmartStructuralOCR(req: SmartStructuralOCRRequest, cb?: (error: string, rep: SmartStructuralOCRResponse) => void): Promise<SmartStructuralOCRResponse>; /** * 本接口支持作业算式题目的自动识别和判分,目前覆盖 K12 学力范围内的 11 种题型,包括加减乘除四则、加减乘除已知结果求运算因子、判断大小、约等于估算、带余数除法、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式计算和解方程,平均识别精度达到93%以上。 默认接口请求频率限制:10次/秒。 */ ArithmeticOCR(req: ArithmeticOCRRequest, cb?: (error: string, rep: ArithmeticOCRResponse) => void): Promise<ArithmeticOCRResponse>; /** * 本接口支持对中国大陆机动车车牌的自动定位和识别,返回地域编号和车牌号码与车牌颜色信息。 默认接口请求频率限制:10次/秒。 */ LicensePlateOCR(req: LicensePlateOCRRequest, cb?: (error: string, rep: LicensePlateOCRResponse) => void): Promise<LicensePlateOCRResponse>; /** * 本接口支持不动产权证关键字段的识别,包括使用期限、面积、用途、权利性质、权利类型、坐落、共有情况、权利人、权利其他状况等。 默认接口请求频率限制:5次/秒。 */ EstateCertOCR(req: EstateCertOCRRequest, cb?: (error: string, rep: EstateCertOCRResponse) => void): Promise<EstateCertOCRResponse>; /** * 支持身份证、护照、名片、银行卡、行驶证、驾驶证、港澳台通行证、户口本、港澳台来往内地通行证、港澳台居住证、不动产证、营业执照的智能分类。 默认接口请求频率限制:20次/秒。 */ ClassifyDetectOCR(req: ClassifyDetectOCRRequest, cb?: (error: string, rep: ClassifyDetectOCRResponse) => void): Promise<ClassifyDetectOCRResponse>; /** * 公式识别是教育的基础OCR识别能力,可支持理科(数学、物理、化学、生物)的印刷体和手写体的公式识别。 默认接口请求频率限制:2次/秒。 */ RecognizeFormulaOCR(req: RecognizeFormulaOCRRequest, cb?: (error: string, rep: RecognizeFormulaOCRResponse) => void): Promise<RecognizeFormulaOCRResponse>; /** * 本接口支持各类印章主体内容、印章其他内容及形状识别,支持单图多印章识别,包括发票章、财务章等,适用于公文票据等场景。 默认接口请求频率限制:5次/秒。 */ SealOCR(req: SealOCRRequest, cb?: (error: string, rep: SealOCRResponse) => void): Promise<SealOCRResponse>; /** * 本接口用于识别门头照分类标签信息 默认接口请求频率限制:1次/秒 */ ClassifyStoreName(req: ClassifyStoreNameRequest, cb?: (error: string, rep: ClassifyStoreNameResponse) => void): Promise<ClassifyStoreNameResponse>; /** * 本接口支持银行回单全字段的识别,包括付款开户行、收款开户行、付款账号、收款账号、回单类型、回单编号、币种、流水号、凭证号码、交易机构、交易金额、手续费、日期等字段信息。 默认接口请求频率限制:10次/秒。 */ BankSlipOCR(req: BankSlipOCRRequest, cb?: (error: string, rep: BankSlipOCRResponse) => void): Promise<BankSlipOCRResponse>; /** * 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。 适用于快速文本识别场景。 产品优势:与通用印刷体识别接口相比,精简版虽然在准确率和召回率上有一定损失,但价格更加优惠。 通用印刷体识别不同版本的差异如下: <table style="width:715px"> <thead> <tr> <th style="width:150px"></th> <th >通用印刷体识别(精简版)</th> <th style="width:200px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th> <th><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th> </tr> </thead> <tbody> <tr> <td> 适用场景</td> <td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td> <td>适用于所有通用场景的印刷体识别</td> <td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td> </tr> <tr> <td>识别准确率</td> <td>91%</td> <td>96%</td> <td>99%</td> </tr> <tr> <td>价格</td> <td></td> <td></td> <td></td> </tr> <tr> <td>支持的语言</td> <td>中文、英文、中英文</td> <td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td> <td>中文、英文、中英文</td> </tr> <tr> <td>自动语言检测</td> <td>支持</td> <td>支持</td> <td>支持</td> </tr> <tr> <td>返回文本行坐标</td> <td>支持</td> <td>支持</td> <td>支持</td> </tr> <tr> <td>自动旋转纠正</td> <td>支持旋转识别,返回角度信息</td> <td>支持旋转识别,返回角度信息</td> <td>支持旋转识别,返回角度信息</td> </tr> </tbody> </table> 默认接口请求频率限制:10次/秒。 */ GeneralEfficientOCR(req: GeneralEfficientOCRRequest, cb?: (error: string, rep: GeneralEfficientOCRResponse) => void): Promise<GeneralEfficientOCRResponse>; /** * 本接口支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。 产品优势:针对广告商品图片普遍存在较多繁体字、艺术字的特点,进行了识别能力的增强。支持中英文、横排、竖排以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。 默认接口请求频率限制:20次/秒。 */ AdvertiseOCR(req: AdvertiseOCRRequest, cb?: (error: string, rep: AdvertiseOCRResponse) => void): Promise<AdvertiseOCRResponse>; /** * 本接口支持火车票全字段的识别,包括编号、出发站、到达站、出发时间、车次、座位号、姓名、票价、席别、身份证号、发票消费类型、序列号、加收票价、手续费、大写金额、售票站、原票价、发票类型、收据号码、是否仅供报销使用等字段的识别。 默认接口请求频率限制:5次/秒。 */ TrainTicketOCR(req: TrainTicketOCRRequest, cb?: (error: string, rep: TrainTicketOCRResponse) => void): Promise<TrainTicketOCRResponse>; /** * 本接口支持居民户口簿户主页及成员页关键字段的识别,包括姓名、户别、地址、籍贯、身份证号码等。 默认接口请求频率限制:5次/秒。 */ ResidenceBookletOCR(req: ResidenceBookletOCRRequest, cb?: (error: string, rep: ResidenceBookletOCRResponse) => void): Promise<ResidenceBookletOCRResponse>; /** * 本接口支持通信大数据行程卡识别,包括行程卡颜色、更新时间、途经地、存在中高风险地区的城市、电话号码,五个字段的识别结果输出。 默认接口请求频率限制:20次/秒。 */ RecognizeTravelCardOCR(req: RecognizeTravelCardOCRRequest, cb?: (error: string, rep: RecognizeTravelCardOCRResponse) => void): Promise<RecognizeTravelCardOCRResponse>; /** * 本接口支持事业单位法人证书关键字段识别,包括注册号、有效期、住所、名称、法定代表人等。 默认接口请求频率限制:5次/秒。 */ InstitutionOCR(req: InstitutionOCRRequest, cb?: (error: string, rep: InstitutionOCRResponse) => void): Promise<InstitutionOCRResponse>; /** * 本接口支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。 默认接口请求频率限制:10次/秒。 */ EnglishOCR(req: EnglishOCRRequest, cb?: (error: string, rep: EnglishOCRResponse) => void): Promise<EnglishOCRResponse>; /** * 本接口支持二代身份证、临时身份证、港澳台居住证、外国人永久居留证,字段内容识别功能,包括姓名、性别、民族、出生、出生日期、住址、公民身份号码、签发机关、有效期限、国籍、通行证号码、持证人持有号码;支持返回证件类型;支持翻拍、复印、边框不完整、遮挡、字段级反光和字段级完整性告警;支持卡片主体框裁剪和头像裁剪。 默认接口请求频率限制:5次/秒。 */ RecognizeValidIDCardOCR(req: RecognizeValidIDCardOCRRequest, cb?: (error: string, rep: RecognizeValidIDCardOCRResponse) => void): Promise<RecognizeValidIDCardOCRResponse>; /** * 本接口支持对中国大陆主流银行卡正反面关键字段的检测与识别,包括卡号、卡类型、卡名字、银行信息、有效期。支持竖排异形卡识别、多角度旋转图片识别。支持对复印件、翻拍件、边框遮挡的银行卡进行告警,可应用于各种银行卡信息有效性校验场景,如金融行业身份认证、第三方支付绑卡等场景。 默认接口请求频率限制:10次/秒。 */ BankCardOCR(req: BankCardOCRRequest, cb?: (error: string, rep: BankCardOCRResponse) => void): Promise<BankCardOCRResponse>; /** * 本接口支持机动车销售统一发票和二手车销售统一发票的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。 默认接口请求频率限制:5次/秒。 */ CarInvoiceOCR(req: CarInvoiceOCRRequest, cb?: (error: string, rep: CarInvoiceOCRResponse) => void): Promise<CarInvoiceOCRResponse>; /** * 本接口支持驾驶证主页和副页所有字段的自动定位与识别,重点字段的识别准确度达到99%以上。 驾驶证主页:包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位 驾驶证副页:包括证号、姓名、档案编号、记录。 另外,本接口还支持复印件、翻拍告警功能。同时支持识别交管12123 APP发放的电子驾驶证正页。 电子驾驶证正页:包括证号、姓名、性别、国籍、出生日期、初次领证日期、准驾车型、有效期开始时间、有效期截止时间、档案编号、状态、累积记分。 默认接口请求频率限制:10次/秒。 */ DriverLicenseOCR(req: DriverLicenseOCRRequest, cb?: (error: string, rep: DriverLicenseOCRResponse) => void): Promise<DriverLicenseOCRResponse>; /** * 智能识别并结构化港澳台居民来往内地通行证正面全部字段,包含中文姓名、英文姓名、性别、出生日期、签发机关、有效期限、证件号、签发地点、签发次数、证件类别。 默认接口请求频率限制:20次/秒。 */ MainlandPermitOCR(req: MainlandPermitOCRRequest, cb?: (error: string, rep: MainlandPermitOCRResponse) => void): Promise<MainlandPermitOCRResponse>; /** * 本接口支持识别主流初高中数学符号和公式,返回公式的 Latex 格式文本。 默认接口请求频率限制:5次/秒。 */ FormulaOCR(req: FormulaOCRRequest, cb?: (error: string, rep: FormulaOCRResponse) => void): Promise<FormulaOCRResponse>; /** * 本接口支持中国大陆地区护照个人资料页多个字段的检测与识别。已支持字段包括英文姓名、中文姓名、国家码、护照号、出生地、出生日期、国籍英文、性别英文、有效期、签发地点英文、签发日期、持证人签名、护照机读码(MRZ码)等。 默认接口请求频率限制:10次/秒。 */ PassportOCR(req: PassportOCRRequest, cb?: (error: string, rep: PassportOCRResponse) => void): Promise<PassportOCRResponse>; /** * 本接口支持常见银行票据的自动分类和识别。整单识别包括支票(含现金支票、普通支票、转账支票),承兑汇票(含银行承兑汇票、商业承兑汇票)以及进账单等,适用于中国人民银行印发的 2010 版银行票据凭证版式(银发[2010]299 号)。 默认接口请求频率限制:5次/秒。 */ FinanBillOCR(req: FinanBillOCRRequest, cb?: (error: string, rep: FinanBillOCRResponse) => void): Promise<FinanBillOCRResponse>; /** * 获取ocr的token值 */ GetOCRToken(req: GetOCRTokenRequest, cb?: (error: string, rep: GetOCRTokenResponse) => void): Promise<GetOCRTokenResponse>; /** * 本接口支持OFD格式的增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(铁路电子客票)、电子发票(航空运输电子客票行程单)识别,返回发票代码、发票号码、开票日期、验证码、机器编号、密码区,购买方和销售方信息,包括名称、纳税人识别号、地址电话、开户行及账号,以及价税合计、开票人、收款人、复核人、税额、不含税金额等字段信息。 */ VerifyOfdVatInvoiceOCR(req: VerifyOfdVatInvoiceOCRRequest, cb?: (error: string, rep: VerifyOfdVatInvoiceOCRResponse) => void): Promise<VerifyOfdVatInvoiceOCRResponse>; /** * 本接口支持 单张、多张、多类型 票据的混合识别,同时支持自选需要识别的票据类型,已支持票种包括:增值税发票(专票、普票、卷票)、全电发票、非税发票、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,并支持其他类发票的识别。 默认接口请求频率限制:5次/秒。 */ MixedInvoiceOCR(req: MixedInvoiceOCRRequest, cb?: (error: string, rep: MixedInvoiceOCRResponse) => void): Promise<MixedInvoiceOCRResponse>; /** * 本接口支持北京、上海、广东、江苏、吉林、黑龙江、天津、辽宁、浙江、河南、四川、贵州、山东、安徽、福建、江西、湖北、湖南等省份健康码的识别,包括持码人姓名、持码人身份证号、健康码更新时间、健康码颜色、核酸检测结果、核酸检测间隔时长、核酸检测时间,疫苗接种信息,八个字段的识别结果输出。不同省市健康码显示的字段信息有所不同,上述字段的识别结果可能为空,以图片上具体展示的信息为准。 默认接口请求频率限制:10次/秒。 */ RecognizeHealthCodeOCR(req: RecognizeHealthCodeOCRRequest, cb?: (error: string, rep: RecognizeHealthCodeOCRResponse) => void): Promise<RecognizeHealthCodeOCRResponse>; /** * 本接口支持数学试题内容的识别和结构化输出,包括通用文本解析和小学/初中/高中数学公式解析能力(包括91种题型,180种符号),公式返回格式为 Latex 格式文本。 默认接口请求频率限制:5次/秒。 */ EduPaperOCR(req: EduPaperOCRRequest, cb?: (error: string, rep: EduPaperOCRResponse) => void): Promise<EduPaperOCRResponse>; /** * 本接口支持网约车运输证关键字段的识别,包括交运管许可字号、车辆所有人、车辆号牌、起始日期、截止日期、发证日期。 默认接口请求频率限制:5次/秒。 */ RideHailingTransportLicenseOCR(req: RideHailingTransportLicenseOCRRequest, cb?: (error: string, rep: RideHailingTransportLicenseOCRResponse) => void): Promise<RideHailingTransportLicenseOCRResponse>; /** * 本接口支持泰国身份证识别,识别字段包括泰文姓名、英文姓名、地址、出生日期、身份证号码、首次领用日期、签发日期等字段。 本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect) 默认接口请求频率限制:10次/秒 */ RecognizeThaiIDCardOCR(req: RecognizeThaiIDCardOCRRequest, cb?: (error: string, rep: RecognizeThaiIDCardOCRResponse) => void): Promise<RecognizeThaiIDCardOCRResponse>; /** * 本接口支持 PDF多页(最多30页)、一页中单张、多张、类型票据的混合识别,同时支持单选识别某类票据,已支持票种包括:增值税发票(专票、普票、卷票、区块链发票、通行费发票)、全电发票(专票、普票)、非税发票(通用票据、统一缴纳书)、定额发票、通用机打发票、购车发票(机动车销售发票、二手车发票)、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票等常用标准报销发票,支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(机票行程单)、电子发票(铁路电子客票)的第一页识别,并支持非上述类型的其他发票的智能识别,点击[立即试用](https://cloud.tencent.com/product/ocr)。 默认接口请求频率限制:5次/秒。 支持返回的细项目子票种SubType、子票种中文TypeDescription、以及对应所属大类票种Type 的说明如下列表: <table style="width:715px"> <thead> <tr> <th style="width:200px">SubType 子票种英文</th> <th style="width:200px">TypeDescription子票种中文</th> <th >Type 所属大类票种</th> </tr> </thead> <tbody> <tr> <td> VatSpecialInvoice</td> <td> 增值税专用发票 </td> <td> 3 </td> </tr> <tr> <td> VatCommonInvoice</td> <td> 增值税普通发票 </td> <td> 3 </td> </tr> <tr> <td> VatElectronicCommonInvoice </td> <td> 增值税电子普通发票 </td> <td> 3 </td> </tr> <tr> <td> VatElectronicSpecialInvoice </td> <td> 增值税电子专用发票 </td> <td> 3 </td> </tr> <tr> <td> VatElectronicInvoiceBlockchain</td> <td> 区块链电子发票 </td> <td> 3 </td> </tr> <tr> <td> VatElectronicInvoiceToll</td> <td> 增值税电子普通发票(通行费)</td> <td> 3 </td> </tr> <tr> <td> VatSalesList</td> <td> 增值税销货清单</td> <td> 3 </td> </tr> <tr> <td> VatElectronicSpecialInvoiceFull</td> <td> 电子发票(专用发票)</td> <td> 16 </td> </tr> <tr> <td> VatElectronicInvoiceFull</td> <td> 电子发票(普通发票) </td> <td> 16 </td> </tr> <tr> <td> ElectronicFlightTicketFull</td> <td> 电子发票(机票行程单)</td> <td> 16 </td> </tr> <tr> <td> ElectronicTrainTicketFull</td> <td> 电子发票(铁路电子客票)</td> <td> 16 </td> </tr> <tr> <td> MotorVehicleSaleInvoice </td> <td> 机动车销售统一发票 </td> <td> 12 </td> </tr> <tr> <td> UsedCarPurchaseInvoice </td> <td> 二手车销售统一发票 </td> <td> 12 </td> </tr> <tr> <td> VatInvoiceRoll </td> <td> 增值税普通发票(卷票) </td> <td> 11 </td> </tr> <tr> <td> TaxiTicket </td> <td> 出租车发票 </td> <td> 0 </td> </tr> <tr> <td> QuotaInvoice </td> <td> 定额发票 </td> <td> 1 </td> </tr> <tr> <td> TrainTicket </td> <td> 火车票 </td> <td> 2 </td> </tr> <tr> <td> AirTransport </td> <td> 机票行程单 </td> <td> 5 </td> </tr> <tr> <td> MachinePrintedInvoice </td> <td> 通用机打发票 </td> <td> 8 </td> </tr> <tr> <td> BusInvoice </td> <td> 汽车票 </td> <td> 9 </td> </tr> <tr> <td> ShippingInvoice </td> <td> 轮船票 </td> <td> 10 </td> </tr> <tr> <td> NonTaxIncomeGeneralBill </td> <td> 非税收入通用票据 </td> <td> 15 </td> </tr> <tr> <td> NonTaxIncomeElectronicBill </td> <td> 非税收入一般缴款书(电子) </td> <td> 15 </td> </tr> <tr> <td> TollInvoice </td> <td> 过路过桥费发票 </td> <td> 13 </td> </tr> <tr> <td> MedicalOutpatientInvoice </td> <td> 医疗门诊收费票据(电子) </td> <td> 17 </td> </tr> <tr> <td> MedicalHospitalizedInvoice </td> <td> 医疗住院收费票据(电子) </td> <td> 17 </td> </tr> <tr> <td> TaxPayment </td> <td> 完税凭证 </td> <td> 18 </td> </tr> <tr> <td> CustomsPaymentReceipt </td> <td> 海关缴款 </td> <td> 19 </td> </tr> <tr> <td> BankSlip </td> <td> 银行回单 </td> <td> 20 </td> </tr> <tr> <td> OtherInvoice </td> <td> 其他发票 </td> <td> -1 </td> </tr> </tbody> </table> */ RecognizeGeneralInvoice(req: RecognizeGeneralInvoiceRequest, cb?: (error: string, rep: RecognizeGeneralInvoiceResponse) => void): Promise<RecognizeGeneralInvoiceResponse>; /** * 本接口支持行驶证主页和副页所有字段的自动定位与识别。 行驶证主页:车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期、发证单位。 行驶证副页:号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录。 另外,本接口还支持复印件、翻拍告警功能。 默认接口请求频率限制:10次/秒。 */ VehicleLicenseOCR(req: VehicleLicenseOCRRequest, cb?: (error: string, rep: VehicleLicenseOCRResponse) => void): Promise<VehicleLicenseOCRResponse>; }