怎么用Python来理清楚红楼梦里的关系-快上网网站建设公司

怎么用Python来理清楚红楼梦里的关系

本篇文章为大家展示了怎么用Python来理清楚红楼梦里的关系，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。

我们提供的服务有：做网站、网站设计、微信公众号开发、网站优化、网站认证、罗城ssl等。为近千家企事业单位解决了网站和推广的问题。提供周到的售前咨询和贴心的售后服务，是有科学管理、有技术的罗城网站制作公司

最近把红楼梦又抽空看了一遍，古典中的经典，我真无法用言辞赞美她。今天，想跟大家一起用 Python 来理一理红楼梦中的的那些关系

不要问我为啥是红楼梦，而不是水浒三国或西游，都是经典，但我个人还是更喜欢偏古典的书，红楼梦也是我多次反复品读的为数不多的小说，对它的感情也是最深的。

好了好了这些都不重要，重要的是我们今天要用Python来理红楼梦的关系！

数据准备

红楼梦 TXT 文件一份
金陵十二钗 + 贾宝玉人物名称列表
人物列表内容如下：

宝玉 nr

黛玉 nr

宝钗 nr

湘云 nr

凤姐 nr

李纨 nr

元春 nr

迎春 nr

探春 nr

惜春 nr

妙玉 nr

巧姐 nr

秦氏 nr

这份列表，同时也是为了做分词时使用，后面的 nr 就是人名的意思。

数据处理

读取数据并加载词典

 with open("红楼梦.txt", encoding='gb18030') as f:
 honglou = f.readlines()
 jieba.load_userdict("renwu_forcut")
 renwu_data = pd.read_csv("renwu_forcut", header=-1)
 mylist = [k[0].split(" ")[0] for k in renwu_data.values.tolist()]

这样，我们就把红楼梦读取到了 honglou 这个变量当中，同时也通过 load_userdict 将我们自定义的词典加载到了 jieba 库中。

对文本进行分词处理并提取

tmpNames = []
 names = {}
 relationships = {}
 for h in honglou:
 h.replace("贾妃", "元春")
 h.replace("李宫裁", "李纨")
 poss = pseg.cut(h)
 tmpNames.append([])
 for w in poss:
 if w.flag != 'nr' or len(w.word) != 2 or w.word not in mylist:
 continue
 tmpNames[-1].append(w.word)
 if names.get(w.word) is None:
 names[w.word] = 0
 relationships[w.word] = {}
 names[w.word] += 1

首先，因为文中"贾妃", “元春”，“李宫裁”, “李纨” 混用严重，所以这里直接做替换处理。

然后使用 jieba 库提供的 pseg 工具来做分词处理，会返回每个分词的词性。

之后做判断，只有符合要求且在我们提供的字典列表里的分词，才会保留。

一个人每出现一次，就会增加一，方便后面画关系图时，人物 node 大小的确定。

对于存在于我们自定义词典的人名，保存到一个临时变量当中 tmpNames。

处理人物关系

 for name in tmpNames:
 for name1 in name:
 for name2 in name:
 if name1 == name2:
 continue
 if relationships[name1].get(name2) is None:
 relationships[name1][name2] = 1
 else:
 relationships[name1][name2] += 1

对于出现在同一个段落中的人物，我们认为他们是关系紧密的，每同时出现一次，关系增加1.

保存到文件

 with open("relationship.csv", "w", encoding='utf-8') as f:
 f.write("Source,Target,Weight\n")
 for name, edges in relationships.items():
 for v, w in edges.items():
 f.write(name + "," + v + "," + str(w) + "\n")
 with open("NameNode.csv", "w", encoding='utf-8') as f:
 f.write("ID,Label,Weight\n")
 for name, times in names.items():
 f.write(name + "," + name + "," + str(times) + "\n")

文件1：人物关系表，包含首先出现的人物、之后出现的人物和一同出现次数
文件2：人物比重表，包含该人物总体出现次数，出现次数越多，认为所占比重越大。

制作关系图表

使用 pyecharts 作图

def deal_graph():
 relationship_data = pd.read_csv('relationship.csv')
 namenode_data = pd.read_csv('NameNode.csv')
 relationship_data_list = relationship_data.values.tolist()
 namenode_data_list = namenode_data.values.tolist()
 nodes = []
 for node in namenode_data_list:
 if node[0] == "宝玉":
 node[2] = node[2]/3
 nodes.append({"name": node[0], "symbolSize": node[2]/30})
 links = []
 for link in relationship_data_list:
 links.append({"source": link[0], "target": link[1], "value": link[2]})
 g = (
 Graph()
 .add("", nodes, links, repulsion=8000)
 .set_global_opts(title_opts=opts.TitleOpts(title="红楼人物关系"))
 )
 return g

首先把两个文件读取成列表形式
对于“宝玉”，由于其占比过大，如果统一进行缩放，会导致其他人物的 node 过小，展示不美观，所以这里先做了一次缩放

最后得出的关系图

怎么用Python来理清楚红楼梦里的关系

上述内容就是怎么用Python来理清楚红楼梦里的关系，你们学到知识或技能了吗？如果还想学到更多技能或者丰富自己的知识储备，欢迎关注创新互联行业资讯频道。

分享题目：怎么用Python来理清楚红楼梦里的关系
转载来源：http://www.cdkjz.cn/article/ggsihc.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

怎么用Python来理清楚红楼梦里的关系

数据准备

数据处理

制作关系图表

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

怎么用Python来理清楚红楼梦里的关系

数据准备

数据处理

制作关系图表

相关资讯

vue的传值方式有哪些

虚拟主机是按照什么收费

oracle/mysql拼接值遇到的坑及双竖线||和concat怎么使用

Linux下如何安装OpenSSL

Centos64位桌面版怎么安装

Linux系统中常见的文件系统有哪些?

redis怎么配置文件和java客户端连接

怎么在Python中引入第三方模块

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接