Skip to content
This repository was archived by the owner on Dec 17, 2018. It is now read-only.
树华 edited this page Mar 20, 2018 · 7 revisions

配置

在config/config.ini中,可以进行一些属性的相关配置。

[account]
;由于专利网站的改版,现在要求必须要登录账号密码才能进行高级查询,
;请使用者到专利网站自行注册账号,并修改一下USERNAME和PASSWORD的值
;链接:http://www.pss-system.gov.cn/sipopublicsearch/portal/uiregister-showRegisterPage.shtml

;用户名
username=
;密码
password=
[proxy]
;程序的代理决定使用https://github.com/jhao104/proxy_pool的代理池作为代理方式,若使用者有更好的方式请自行修改proxy_url

;是否使用代理[False, True]
use_proxy=False
;代理url,若use_proxy为False则忽略此项
proxy_url=http://127.0.0.1:5010/get

[output]
;输出内容,可选(data:数据库, excel:excel, log:记录(若无则输出到控制台), chart:图表(若无data则忽略此项))
items=[data, log, chart]

[request]
;请求超时设置,单位秒
timeout=10
; 请求延时设置,单位秒
delay=1

[crawler]
; 采集内容配置
; 详情见https://github.com/will4906/PatentCrawler/wiki/Config
content=[专利名称, 申请号, 申请日, 摘要, 法律状态表]

采集内容配置

现阶段已经可以支持多表

key chinese english multi-tables is_required
专利id 专利标志,专利id,专利ID,专利Id patent_id False True
专利名称 专利名称 patent_name,invention_name False True
申请号 申请号 request_number,application_number False False
申请日 申请日 request_date False False
摘要 摘要 abstract False False
公开(公告)号 公开号,公布号,公开(公告)号 publish_number False False
公开(公告)日 公开日,公布日,公开(公告)日 publish_date False False
IPC分类号 IPC分类号 ipc_class_number,IPC,ipc,Ipc False False
申请人 申请人,专利权人,专利人,申请(专利权)人 Applicant,applicant,assignee,Assignee,proposer False False
发明人 发明人 Inventor,inventor False False
优先权号 优先权号 priority_number False False
优先权日 优先权日 priority_date False False
申请人地址 申请人地址 proposer_address,address_of_the_Applicant,applicant_address False False
申请人邮编 申请人邮编 proposer_post_code,zip_code_of_the_applicant,proposer_zip_code False False
申请人所在国(省) 申请人所在国(省),申请人所在地 proposer_location,country_of_the_applicant,country_of_the_assignee False False
CPC分类号 CPC分类号 cpc_class_number,cpc,CPC,Cpc False False
同族表 同族表 cognation_list True False
法律状态表 法律状态表 law_state_list True False
Clone this wiki locally