您当前的位置: > 详细浏览

中文社交媒体用户性别预测研究——以新浪微博短文本内容为例

请选择邀稿期刊:

Research on Gender Prediction of Chinese Social Media Users ——Taking Sina Weibo Short Text Content as an Example

摘要: [ 目的 / 意义 ] 与互联网的高速发展不同,个人信息安全保护的发展相对滞后,通过预 测社交媒体用户的性别,能够更好地针对不同性别用户提供隐私保护。[ 方法 / 过程 ] 以新浪 微博这一社交媒体中用户发布的短文本为研究对象,从中抽取语言特征和主题特征,为每一个 用户构建基于语言特征、主题特征以及两个特征叠加的特征表达向量,利用 SVM 机器学习算法 构建性别预测的分类器。[ 结果 / 结论 ] 实验表明,从微博短文本中抽取的语言特征和主题特 征能够准确预测用户性别,其效果在主要评价指标中均有大幅提升。

版本历史

[V1] 2023-10-08 09:44:07 ChinaXiv:202310.02964V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量277
  •  下载量110
评论
分享