Beyonce文艺复兴专辑:Twitter情感分析
义工
Beyonce发布第七工作室专辑文艺复兴时,我很好奇计及她前相册的巨大成功, 我想知道我对这相册会有什么感想有个人最爱吗下一位我想知道Twitter社群对相册有何感想他们爱它吗if they did, why他们爱它
学习文字挖掘、情感分析 自然语言处理使用TwitterAPI与Python库Tweepy约十天挖掘Twitter标签RenaisanceTweets本分析使用范围从7月24日到2022年8月2日
身为她时代最有影响力的艺人之一,
音乐曲迷最爱的
何时人们主动推介相册
位置推文最多
多数使用音乐正面词
文艺复兴推文常用词
.Twitter用户情感
.相册在Twitter上一般表现如何
项目方法
项目主要步骤概述如下:
- 数据串通(数据采集、数据评估和数据清理)
- 提取标签和音乐轨迹
- 数据预处理
- 情感分析
- 解释分析/数据可视化
- PowerBI机板
数据写作
数据串通是每一数据分析过程的必要步骤过程包括集合推文评估后清理从Twitter上收集Tweets使用TwitterAPI和Python图书馆Twewi我从导入某些必备库开始搜索查询时使用#Renaissance标签,微博调查后, 我注意到人们用错误拼写Hashtag #Rennaissa
三批收集数据是因为Twitter7天限制Twitter提取并存储单个csv文件后全部附为单数据框帮助我拉出新推文和老推文深入阅读来.接下去,我评估数据框架寻找重复数据 缺失数据 错误数据类型我记下我对Jupyter笔记本上记分数评分
有几个数据质量问题我通过评估发现
数据框架、无关列、无名:0和位置列缺失值中显然有重复值清理前我拷贝资料并修复所有数据质量问题记分
提取广度Hashta,
REGEX函数从Tweets提取所有标签到新列
基本说来,函数I使用会发现所有实例推文中字以#标签开始并包含1或多字母数字符
提取流行音乐音轨
函数转换小写字符
函数定义使用Regex消除空格取代多词单词完成此操作后, 音轨都计为单词以避免线下异常
查找轨迹排名
提取相册正面音乐词
评估期间,我注意到推文用词总结相册使用REGEXI替换正词单词取出所有正词到新列
词云淡化最常用词
查找下文,字云显示频繁复用大字小字少词文艺复兴专辑封面与马和骑士相关并分享洞察力
数据代理
数据预处理包含所有数据清洗 准备推文情感分析实现此目标时,我创建数个函数,应用到数据框架内列中产生期望结果使用REGEX,我删除句子,urssssssss并使用 Tokenization将推文破解成单词和lemmatization消除标点
教程分析
情感分析是一种分析文本数据的手段,以确定作者对特定题目、产品或服务的态度是正式、负式或中性式我使用使用文本团ython库获取极度评分极性评分范围从-1-+1不等,它基本显示情感为正负或中立极性评分++0分类为阳性时极度评分<0分类为负数可查看下情感分布
解析分析/数据验证
透视
- 最常用追踪相册教会女孩约7170引用并紧接异形超级星带6835引用
二叉多点Tweets生成清晨5AMGMT精确度
3级前5位位置为洛杉矶CA、亚特兰大GA、美国纽约休士顿TX
限制本分析位置,
约38 300个位置未说明Twitter用户已知使用她、他、她和其他非定位使用地理编码提取经度和纬度坐标肯定对这部分分析有帮助但我无法使用它是因为我需要付费使用Geo编码平台大数据集
深入展示我的洞察力, 我会嵌入PowerBI仪表板和视频下展示交互仪表板
结论
最后,我想说专辑在Twitter上做得很好86.5%的推文收集时间为7月24日至8月2日,Twitter用户常表扬Vocals语言,词类,制作,比特斯并哈密诺斯相册中他们称它为不跳过,无打包专辑
并播下相册发布前的微博 令相册大规模订婚以推广发布前的产品和服务。发布前找人聊天预测有时是每次成功启动成功的关键
Beyonce拥有大型社交媒体后发挥作用, 我推荐企业使用社交媒体影响者提升
这是一个有趣的项目我, 因为我绝对爱音乐, 谁不爱呢?
感谢您抽出时间过关感觉文艺复兴LOL系统
存取密码有链接Github