Merge remote-tracking branch 'origin/master'

# Conflicts:
#	summary/summary juin.md
This commit is contained in:
xiaobulu27 2023-07-07 08:47:14 +08:00
commit e3a77c94ec
2 changed files with 3 additions and 6 deletions

View File

@ -165,7 +165,6 @@
“三严三实”学习专题教育,“三严三实”专题教育,固定表述错误
“三严三实”主题教育,“三严三实”专题教育,固定表述错误
“三严三实”主题教育活动,“三严三实”专题教育,固定表述错误
“三严三实”专题教育,“三严三实”专题教育,固定表述错误
“三严三实”专题教育活动,“三严三实”专题教育,固定表述错误
“三严三实”专题学习教育,“三严三实”专题教育,固定表述错误
“三严三实”专项教育,“三严三实”专题教育,固定表述错误

1 错误表述 建议修改词语 错误分类
165 “三严三实”学习专题教育 “三严三实”专题教育 固定表述错误
166 “三严三实”主题教育 “三严三实”专题教育 固定表述错误
167 “三严三实”主题教育活动 “三严三实”专题教育 固定表述错误
“三严三实”专题教育 “三严三实”专题教育 固定表述错误
168 “三严三实”专题教育活动 “三严三实”专题教育 固定表述错误
169 “三严三实”专题学习教育 “三严三实”专题教育 固定表述错误
170 “三严三实”专项教育 “三严三实”专题教育 固定表述错误

View File

@ -6,19 +6,17 @@
目前爬取并分析了阵地类型为官方网站、微信公众号两种类型的数据其中官网网站69个成功爬取63个微信公众号102个。
其中官方网站爬取了同域名下所有链接地址,微信公众号爬取了历史所有文章。
共爬取网页数量27876页公众号文章4153篇
## 分析结果
通过对爬取结果进行分析并与标准文档比对分别在27876页网页中发现错误100处在4153篇公众号中发现错误33处具体见结果表
根据分析要求进行得到分析结果官方网站共发现错误187处公众号共发现错误39处。具体见结果表
## 存在问题
目前存在部分网站因反爬措施或无法访问或技术原因,未获取到数据,见下表
目前存在部分网站因各种原因,未获取到数据,见下表
| 单位 | 可能原因 |
| ---- | ---- |
| 中国建筑材料科学研究总院有限公司_http://www.cbma.com | 网址错误 |
| 对比服务平台_http://www.ctc-online.cn/companyLogin?company | 网站需登录 |
| 中国建筑材料科学研究总院有限公司_http://www.cbma.com | 不能访问 |
| 中国建材检验认证集团江苏有限公司_http://www.ctcjs.com | 不能访问 |
| 乌鲁木齐京诚检测技术有限公司_http://www.wlmqjc.cn/ | 网站域名过期 |
| 中材江西电瓷电气有限公司_http://www.sinoma-insulator.com | 不能访问 |