中文社交媒体用户性别预测研究——以新浪微博短文本内容为例
Research on Gender Prediction of Chinese Social Media Users
——Taking Sina Weibo Short Text Content as an Example
-
作者:
刘雅琦
1
李得志
2
王瑞雪
3
-
作者单位:
-
提交时间:2023-10-08 09:44:07
摘要: [ 目的 / 意义 ] 与互联网的高速发展不同,个人信息安全保护的发展相对滞后,通过预
测社交媒体用户的性别,能够更好地针对不同性别用户提供隐私保护。[ 方法 / 过程 ] 以新浪
微博这一社交媒体中用户发布的短文本为研究对象,从中抽取语言特征和主题特征,为每一个
用户构建基于语言特征、主题特征以及两个特征叠加的特征表达向量,利用 SVM 机器学习算法
构建性别预测的分类器。[ 结果 / 结论 ] 实验表明,从微博短文本中抽取的语言特征和主题特
征能够准确预测用户性别,其效果在主要评价指标中均有大幅提升。
版本历史
[V1] |
2023-10-08 09:44:07 |
ChinaXiv:202310.02964V1
|
下载全文 |