当前位置: > 财经>正文

计算机专业大数据开题报告怎么写?基于python的电商产品评论的用户情感分析与研究 外汇与黄金的关系图解分析论文怎么写

2023-08-26 07:42:22 互联网 未知 财经

计算机专业大数据开题报告怎么写?基于python的电商产品评论的用户情感分析与研究

一、选题依据(包括项目研究的背景、研究或应用的意义、国内外研究或应用现状,附主要参考文献)

(一)研究的背景

随着互联网的飞速发展,网上购物已经成为大众生活的重要组成部分。人们在电商平台上浏览商品并购物,基本上所有的电子商务网站都支持消费者对产品的相关内容(商品、服务、卖家)等进行打分和发表评论从而产生了海量的用户行为数据,用户对商品的评论数据对商家具有重要的意义。对于用户来说对于一些未知体验产品,用户可以通过网络来获取产品信息,特别是对一些未知的体验产品,用户为了降低自身的风险更加倾向于得到其他用户的意见和看法,这些评论对潜在的买家而言无疑是一笔财富,并以此作为决策的重要依据。对于卖家来说,可以从评论信息中获取用户的实际需求,以改善产品品质,提高自身的竞争力。利用好这些碎片化、非结构化的数据,将有利于企业在电商平台上的持续发展,同时,对这部分数据进行分析,依据评论数据来优化现有产品也是大数据在企业经营中的实际应用。

(二) 研究的意义

评论信息中蕴含着消费者对特定产品和服务的主观感受,反映了⼈们的态度、⽴场和意见,具有⾮常宝贵的研究价值。⼀⽅⾯,对企业来说,企业需要根据海量的评论⽂本数据去更好地了解⽤户的个⼈喜好,从⽽提⾼产品质量、改善服务,获取市场上的竞争优势。另⼀⽅⾯,消费者需要在没有看到真正的产品实体、做出购买决策之前,根据其他购物者的评论了解产品的质量、性价⽐等信息,为购物抉择提供参考依据,翻阅买家评论是最直观的决策要素之一。

(二) 国内外研究现状

情感分析针对使用人群可划分为两类:一种是针对消费者提供的情感分析,一种是针对生产者提供的情感分析。

针对消费者提供的情感分析主要应用于主流购物网站,作为网站的一个功能模块,提供消费者浏览参考。国内的京东、天猫,国外的亚马逊等购物网站都提供了情感分析功能模块。随着理论和技术的不断发展,这些网站的评论管理也从一开始的好评差评分类,进化成情感标签模式的评论分类。

针对生产者的情感分析多数为研究人员开发设计,作为一个独立的系统运行。国内外的研究人员开发出了多个情感分析系统一方面用来提供给生产者进行情感分析,另一方面用来展示实现学术科研成果。

国内的张爱莲等人开发的基于LTP 系统框架和 Apriori 算法的汽车评论情感分析系统,可以针对评论进行汽车属性的抽取,并确定评价的情感倾向强度。康智凯等人开发的该系统能够根据用户的需求自动的获取网上的信息,通过基于规则和基于统计相结合的产品属性和用户观点抽取方法,自动的识别出用户对相关产品以及产品属性的喜好程度。张迪等人设计的品牌评估系统,基于海量的用户评价信息反映用户对品牌质量的观点,并量化为品牌得分。钟静晨等人开发的商品物流评价系统,基于物流专业术语词典,对用户评价进行情感倾向分析,评估消费者对物流服务的满意度。

与此同时,国外各大研究机构和个人也开发了一些具备研究和实践价值的情感分析系统。

IBM开发的语义关联分析系统,通过训练模型学习不同语言间同一商品属性的语言特点,计算得出该商品属性特征的情感倾向。Gamon等人设计开发的汽车评分情感分析系统,可以确定评论的情感倾向,并得到评论数据图形化的展示。Liu等人设计开发的情感强度分析对比系统,可以提取和对比多个评论数据所蕴含的情感强度并通过图表模型的方式使用户得到一目了然的可视化信息。Wilson等人研究开发的系统可以自动识别并标注带有情感色彩的句子,并提取其中的情感词和情感倾向。Zhang等人研究开发的弱点分析系统,可以根据评论数据的情感倾向分析列出该商品的缺陷属性。

(四)主要参考文献

[1]张爱莲.汽车评论情感分析系统的设计与实现[D].西安电子科技大学,2013.

[2]康智凯.基于文本情感分析技术的用户评论分析系统设计与实现[D].哈尔滨工业大

学,2017.

[3]张迪.基于情感分析的线上品牌评估系统的设计与实现[D].电子科技大学,2017.

[4]钟静晨.电商商品评价情感分析系统研究[D].江苏科技大学,2018.

[5] Guo H,Zhu H,Guo Z,et al. OpinionIt: a text mining system for cross-lingual opinion analysis[C].ACM International Conference on Information and Knowledge Management.ACM,2010:1199-1208.

[6]Gamon M, Aue A, Corstonoliver S, et al. Pulse: Mining Customer Opinions from Free

Text[J].Lecture Notes in Computer Science,2005,3646:121-132.

[7]Liu B, Hu M, Cheng J. Opinion observer: analyzing and comparing opinions on the

Web[C].International Conference on World Wide Web. ACM,2005:342-351.

[8]Wilson T,Hoffmann P,Somasundaran S,et al. OpinionFinder: A System for Subjectivity Analysis.[C]. HLT/EMNLP 2005,Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing,Proceedings of the Conference,6-8 October 2005,Vancouver,British Columbia,Canada.DBLP,2005:34--35.

[9] Zhang W, Xu H, Wan W. Weakness Finder: Find product weakness from Chinese reviews by using aspects based sentiment analysis[J]. Expert Systems with Applications, 2012,39(11):10283-10291.

二、设计或研究内容、预期目标及拟解决的关键问题(此部分为重点阐述内容)。

(一) 研究内容

本次建模针对产品消费者的文本评论数据,在对文本进行基础的数据预处理、中文分词、停用词过滤后,使用 ROST CM6 软件和 Python 等工具对数据进行nlp情感分析,实现对文本评论数据的情感倾向性判断以及所隐藏的信息的挖掘并分析,以期得到有价值的内在内容。

1.用Python编写爬虫,对产品评论数据进行采集;

2.对获取到的数据进行基础的处理操作,包括数据预处理、中文分词、停用词过滤等操作;

3.通过对评论文本数据进行预处理后,运用多种手段对评论数据进行多方面的分析;

4.从对应结果的分析中获取文本评论数据中有价值的内容。

    

(二)预期目标

1.对该产品的评论进行情感分析。

2.从评论文本中挖掘出该产品的优势和不足。

3.根据模型结果给出产品改善的建议,针对品牌的优势提炼出该产品的卖点。

(三)拟解决的关键问题

1.许多文本去重算法通过计算文本之间的相似度,以此为基础去重,包括编辑距离去重、Simhash算法去重等。编辑距离算法去重是计算两条语料的编辑距离,然后进行阈值判断,如果编辑距离小于阈值则进行去重处理。但是有相近的表达的时候就可能也会采取删除操作,这样就会造成错删。

2.文本的正面评价和负面评价混淆在一起,并且由于分词粒度的影响)否定词或程度词等),可能在一个主题下生成一些令人迷惑的词语。

3.由于分词获取前面正负情感结果的文本语料库不太好,对于负面情感结果的 情感词典 并不是很聚焦。

三、研究方案(包括有关方法、技术路线、实验手段、关键技术等)。

(一) 研究方法

1.观察法:研究者根据一定的研究目的,研究提纲和观察表,用自己的感官和辅助工具去观察被研究对象,从而获得资料。

2.项目实验法:通过自主实验,完成对研究从理论到操作的转变,验证是否达到实验要求。

3.⽂献研究法:根据⼀定的研究目的或课题,通过调查⽂献来获得资料,从⽽全⾯地、正确地了解掌握所要研究的问题。

4.通过一些学习资料,掌握环境搭建的方法和处理报错的能力。

(二)技术路线

    1.数据的采集方面,选用了Python和八爪鱼采集器。

版权声明: 本站仅提供信息存储空间服务,旨在传递更多信息,不拥有所有权,不承担相关法律责任,不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请发送邮件至 举报,一经查实,本站将立刻删除。