- 1、本文档共62页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《三国演义》人物出场统计 观察输出结果,同一个人物会有不同的名字,这种情况需要整合处理。同时,与英文词频统计类似,需要排除一些人名无关词汇,如“却说”、“将军”等。 《三国演义》人物出场统计 实例代码10.4 e10.4CalThreeKingdoms.py ? ? ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 #e10.4CalThreeKingdoms.py import jieba excludes = {将军,却说,荆州,二人,不可,不能,如此} txt = open(三国演义.txt, r, encoding=utf-8).read() words = jieba.lcut(txt) counts = {} for word in words: if len(word) == 1: continue elif word == 诸葛亮 or word == 孔明曰: rword = 孔明 elif word == 关公 or word == 云长: rword = 关羽 elif word == 玄德 or word == 玄德曰: rword = 刘备 elif word == 孟德 or word == 丞相: rword = 曹操” ? ? 《三国演义》人物出场统计 实例代码10.4 e10.4CalThreeKingdoms.py ? ? ? 18 19 20 21 22 23 24 25 26 27 else: rword = word counts[rword] = counts.get(rword,0) + 1 for word in excludes: del(counts[word]) items = list(counts.items()) items.sort(key=lambda x:x[1], reverse=True) for i in range(5): word, count = items[i] print ({0:10}{1:5}.format(word, count)) ? ? 《三国演义》人物出场统计 输出排序前5的单词,运行程序后,输出结果如下: ? 曹操 1451 孔明 1383 刘备 1252 关羽 784 张飞 358 请继续完善程序,排除更多无关词汇干扰,总结出场最多的20个人物都有哪些。这里,给出参考答案。 曹操(1451)、孔明(1383)、刘备(1252)、关羽(784)、张飞(358)、 吕布(300)、赵云(278)、孙权(264)、司马懿(221)、周瑜(217)、 袁绍(191)、马超(185)、魏延(180)、黄忠(168)、姜维(151)、 马岱(127)、庞德(122)、孟获(122)、刘表(120)、夏侯惇(116) 列表类型的操作 函数或方法 描述 ls[i] = x 替换列表ls第i数据项为x ls[i: j] = lt 用列表lt替换列表ls中第i到j项数据(不含第j项,下同) ls[i: j: k] = lt 用列表lt替换列表ls中第i到j以k为步的数据 del ls[i: j] 删除列表ls第i到j项数据,等价于ls[i: j]=[] del ls[i: j: k] 删除列表ls第i到j以k为步的数据 ls += lt或ls.extend(lt) 将列表lt元素增加到列表ls中 ls *= n 更新列表ls,其元素重复n次 ls.append(x) 在列表ls最后增加一个元素x ls.clear() 删除ls中所有元素 ls.copy() 生成一个新列表,复制ls中所有元素 ls.insert(i, x) 在列表ls第i位置增加元素x ls.pop(i) 将列表ls中第i项元素取出并删除该元素 ls.remove(x) 将列表中出现的第一个元素x删除 ls.reverse(x) 列表ls中元素反转 列表类型的操作 vlist = list(range(5)) vlist [0, 1, 2, 3, 4] len(vlist[2:]) #计算从第3个位置开始到结尾的子串长度 3 2 in vlist #判断2是否在列表vlist中 True vlist[3]=python #修改序号3的元素值和类型 vlist [0, 1, 2, python, 4] vlist[1:3]=[bit, computer]
您可能关注的文档
- 汽车保险与理赔 保险索赔遭拒的常见情形 新车上牌后未改车牌号索赔遭拒.pptx
- 汽车保险与理赔 保险索赔遭拒的常见情形 准驾不符索赔遭拒.pptx
- 汽车保险与理赔 常见汽车商业保险投保误区 投保汽车商业险2.pptx
- 汽车保险与理赔 底盘定损的修与换 车轮损坏检测认定及修复.pptx
- 汽车保险与理赔 底盘定损的修与换 底盘定损的修与换课件.pptx
- 专业实践课程 6.2.3 说课PPT 说课ppt--王芳媛.pptx
- 汽车保险与理赔 事故车辆定损原则 事故车辆定损原则课件.ppt
- 汽车保险与理赔 调度派工分类 调度派工分类.ppt
- 汽车材料与工艺 汽车材料与工艺 4.2.2 合金结构钢(合金调质钢).ppt
- 汽车材料与工艺 汽车材料与工艺 4.2.3 合金钢工具钢(合金刃具钢).ppt
最近下载
- FITOK飞托克中文样本选型手册-球阀(100504).pdf
- 食堂从业人员食品安全知识考试题及答案.pdf
- 2024年广西安全员B证考试题库附答案.docx
- 自来水厂出水水质调试.docx VIP
- 教育部颁布《中小学教育惩戒规则(试行)》.docx VIP
- 2024年西师版三年级上册数学第三、四单元综合检测试卷及答案.pptx VIP
- 永通电子科技有限公司销售部门360度绩效考核_加水印.pdf
- 20210312-共聚焦和双光子显微镜的原理及应用.pdf VIP
- 职业技术学院智能制造产业学院方案.pptx
- 金徽股份:金徽矿业股份有限公司江洛矿区铅锌矿(300万吨每年)选矿工程可行性研究报告.PDF
文档评论(0)