人工智能培训

搜索

论文代码开源:使用特定于域的字典学习命名实体标记器(Learning Named Entity Tagger using Domain-Specific Dic

[复制链接]
admin 发表于 2018-9-15 10:34:41 | 显示全部楼层 |阅读模式
admin 2018-9-15 10:34:41 1064 0 显示全部楼层
人工智能论文代码开源:使用特定于域的字典学习命名实体标记器(Learning Named Entity Tagger using Domain-Specific Dictionary)请注意该人工智能论文代码开源在github,大部分是python写的,框架可能是tensorflow或者pytorch。我们在不使用额外的上下文信息的情况下解决了将预训练的单词嵌入概括为超出固定大小的词汇表的问题。我们提出了一个子词级单词矢量生成模型,它将单词视为包含字符$ n $ -grams的包。该模型简单,快速训练,并为罕见或看不见的单词提供良好的向量。实验表明,我们的模型在英语单词相似性任务和23种语言中的词性标签和形态句法属性的联合预测中达到了最先进的表现,这表明我们的模型能够捕捉到词的文本表征与其嵌入之间的关系。
We approach the problem of generalizing pre-trained word embeddings beyondfixed-size vocabularies without using additional contextual information.Wepropose a subword-level word vector generation model that views words as bagsof character $n$-grams.The model is simple, fast to train and provides goodvectors for rare or unseen words.Experiments show that our model achievesstate-of-the-art performances in English word similarity task and in jointprediction of part-of-speech tag and morphosyntactic attributes in 23languages, suggesting our model's ability in capturing the relationship betweenwords' textual representations and their embeddings.论文代码开源:使用特定于域的字典学习命名实体标记器(Learning Named Entity Tagger using Domain-Specific Dictionary) waZgX2obobgLvi63.jpg
URL地址:https://arxiv.org/abs/1809.04259v1     ----pdf下载地址:https://arxiv.org/pdf/1809.04259v1    ----         ----github下载地址:https://github.com/jmzhao/bag-of-substring-embedder    ----    论文代码开源:使用特定于域的字典学习命名实体标记器(Learning Named Entity Tagger using Domain-Specific Dictionary)请注意该人工智能论文代码开源在github,大部分是python写的,框架可能是tensorflow或者pytorch,keras,至于具体是哪一个没有完全测试。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 返回列表 发新帖

admin当前离线
管理员

查看:1064 | 回复:0

快速回复 返回顶部 返回列表