Mais conteúdo relacionado
Semelhante a 机器学习推动金融数据智能 (20)
机器学习推动金融数据智能
- 15. • 自然语言处理
• 深度学习
• 图像处理
人工智能
• 分类算法
情绪分类 SVM、LSTM
择时策略 HMM
• 推荐算法
标签关联、知识推荐
• 聚类算法
主题提取
机器学习算法
• 提升数库自己的运营杠杆
• 提升客户的知识决策效率
目标
数库的人工智能应用
- 17. • 预训练的词向量
大规模无监督训练获取词的相关特征。
• 自训练的词向量
依据具体任务场景获取词的相关特征。
• 词性标注向量
现有分词器的词性标注提供先验知识。
• 字向量,未登录词如何处理?
方式1:随机初始化。
方式2:找出同义词替代。
我们的方法:提取词当中的字向量并结合词向量 训练神
经网络,能够解决部分未登录词的问题。
上海 数库 科技 有限公司 <pad>
目标
向量合并
隐藏层
Dropout层
输出分类层
输入
预训练的词向量
自训练的词向量
词性标注向量
经神经网络提取
的字向量
<pad> <pad> 科 技 <pad> <pad>
卷积层
池化层
自训练的字向量
经神经网络提取的字向量
深度学习在命名实体识别上的应用
- 18. • 从海量无标注数据中提取特定情感知识
• 词的情感极性知识
一个词出现在正向情感文本的概率越大,则更有可能蕴含正向情感
信息
情感词极性的上下文依赖、领域依赖、用户个性化依赖、用户社交
关系依赖
• 词与词的情感相似度知识
基于word2vec,反映两个词的依存程度
两个词共现的概率越大,则越可能相近的情感极性
• 情感分类模型训练
• 10w语料标注集(标题、摘要),每个月新增
• 行业情感语料库、事件情感语料库、金融情绪词库
• SVM分类算法
新闻情绪分析