最早小说 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

LIN HUI的算法无论是在实际表现效率上还是算法理论上都是碾压式的领先,而不是领先一点半点。

如果只领先一点半点,那或许是侥幸而已,但碾压式的领先则意味着无法质疑的实力差距。

对此伊芙·卡莉认识的很深刻,LIN HUI提出来的生成式摘要算法甚至开创了一些前所未有的细分领域研究。

比较容易知道的全新细分领域有自然语言处理的情感分析。

这个方向对于以前只进行过抽取式文本摘要研究的伊芙·卡莉来说是个全新的课题。

但这远远不是全部,LIN HUI提出来的生成式摘要算法应该还会涉及很多开创性的东西。

但由于管中窥豹的原因,伊芙·卡莉暂时还不清楚LIN HUI的算法具体涉及到多少开创性的研究。

虽然不清楚具体涉及多少个全新细分领域。

但伊芙·卡莉凭借科研人的直觉,LIN HUI的算法保守估计要涉及到五六个开创性的细分领域研究。

然而也正是因此,让伊芙·卡莉很不理解。

明明LIN HUI的算法领先那么多,为什么还要寻求很多“低级”专利的收购呢?

伊芙·卡莉看了下专利网站上LIN HUI灰谋求收购的那几个专利。

似乎都很“低级”的样子。

说到低级和高级之分,专利本身拿出来并没有低级和高级的分别。

但在一个研究体系中却因负责的分工不同所处的层次不同会出现低级和高级之分。

在LIN HUI提出了生成式文本摘要算法之后。

现在的自动文摘实现方法主要分为抽取式方法和生成式方法。

经过近期对生成式摘要算法技术路线的研究伊芙·卡莉已经能够很容易的理解生成式文本摘要和传统抽取式文本摘要的区别。

所谓的抽取式摘要是从原始文档中提取关键文本单元来组成摘要。

而生成式摘要则是根据对输入原始文本的理解来形成摘要,生成式摘要模型试图去理解文本的内容,可以生成原文中没有的单词,更加接近摘要的本质,具有生成高质量摘要的潜力。

虽然这两者在具体摘要上略有区别,但此二者本质上都是自动文本摘要。

既然二者都是自动文本摘要,那么这两者的技术框架就都可以概括为:

内容表示→权重计算→内容选择→内容组织。

1内容表示是将原始文本划分为文本单元的过程,主要是分字、词、句等预处理工作;

内容表示的主要目的是通过预处理将原始文本处理成算法容易进行分析的形式。

2权重计算则是要对文本单元(即预处理后原始文本)计算相应的权重评分,权重的计算方式多样,如基于特征评分、序列标注、分类模型等提取内容特征计算权重。

这个步骤的目的是通过这一系列计算完成对预处理后的原始文本实现初步分析。

3内容选择是对经过计算权重后的文本单元(即经过步骤2权重分析过的文本)选择相应的文本单元子集组成摘要候选集,可根据要求的摘要长度、线性规划、次模函数、启发式算法等选择文本单元;

4内容组织是指对候选集的内容进行整理形成最终摘要,可根据字数要求按顺序输出,也有研究者提出使用基于语义信息、模板和神经网路学习的方法来产生符合要求的摘要。

(ps:……通俗理解的话,2有点类似于进行文章阅读概括的时候,找出关键段落;

3类似于在2的基础上进一步找出关键句、关键词的过程;

4则类似于确定关键句、关键词之后用合适的语言形成最终阅读概括的过程)

从技术框架的这几个层次的对应描述来看,可以看出无论是权重计算还是内容选择抑或是内容组织此三者都是很重要的。

如果搞不定权重计算和内容选择的话则根本搞不清楚摘要的时候具体对文本哪些地方进行摘要。

毕竟一篇文章不是所有的地方都是重点,就像我们进行阅读概括的时候,一般都会将注意力放在首段末段和每段开头结尾处,可以说权重计算和内容选择所起的作用就是判断要处理的文本的对应文本特征点主要集中在什么位置。

如果搞不定内容组织的话即便能够找出文本特征最密集的地方也没办法得到合理通顺的文本摘要。

内容表示相对于此三者则显得不怎么重要。

正因为上述的分工,如果涉及到文本摘要的东西要分层次的话。

那么和权重计算、内容选择、内容组织这三者相关的专利都可以说是文本摘要这个体系中的高级专利。

而和内容表示有关的专利则是低级专利。

而《文本判断甄别比较的一种新方法》本质上是用来甄别原始文本的。

按照刚才的介绍这无疑是属于和内容表示这个层次的。

就这么一项“低级”专利,

伊芙·卡莉实在搞不懂LIN HUI是为什么寻求购买这样的专利。

莫非真如埃瓦尔德·切瑞所言LIN HUI在乎的不是《文本判断甄别比较的一种新方法》算法专利本身。

LIN HUI在乎的是搞定那个专利的她?

怎么可能?如果只是对她感兴趣,那完全可以直接跟她联系。

毕竟想找到科研工作者的联系方式是很容易的。

伊芙·卡莉猜测了几种可能,也没猜测出合理的解释。

……

尽管有点难以理解。

不过最终伊芙·卡莉还是将《文本判断甄别比较的一种新方法》这项专利卖给LIN HUI了。

毕竟卖家要思考的问题只是买家出价合不合适,而不是思考买家为什么买。

此外,伊芙·卡莉注意到林灰先前求购的专利里已经有一个专利分别以50万美元的价格成功进行转让了。

虽然这个专利的价值不如她的专利价值高,但售卖者却是阿西莱·维拉斯克斯。

伊芙·卡莉记得这个人是谷歌研究院(Google Search,Google AI的前身)高级研究员。

说实话,伊芙·卡莉此前之所以纠结要不要出手这个专利并不是担心自己少赚了钱,主要是担心造成负面影响。

可现在谷歌内部内部的人都不担心因为专利转让造成的负面影响,她还有什么好在乎的。

至于《文本判断甄别比较的一种新方法》这个专利有没有潜在价值这个问题已经不重要了。

伊芙·卡莉倒是蛮期待这个她无论怎样都没看出有什么价值的专利能够在LIN HUI手上焕发出新的生机。

或许LIN HUI会证明没有低级的专利,只有有低级的眼光吧。

喜欢穿越:2014请大家收藏:(www.zuizaoxiaoshuo.net)穿越:2014最早小说更新速度全网最快。

最早小说推荐阅读: 末世:开局一头基多拉重生圣尊傲娇校花爱上我娱乐:我夺舍了刘星!我分裂了无数人格从大学教师开始野性之心重生资本大亨1979闲鱼人生神豪:从百倍返利开始我的1979华娱科幻之王修复师校园超神学生从废土开始模拟城市女神的超级鳌胥林阳夜的命名术萧阳叶云舒超级王者全能侍卫我的美女大小姐玩游戏玩成大佬我的秘书是狐妖拜见猫神大人都市纵横,从修改旁白开始一人之下之龙血炽腾一个在赎罪的主播我的地头儿我做主从港综街头霸王开始万界点名册美女总裁的最强高手求求你们别再说了大国重工纯情校医至尊战神全文免费阅读娱乐:巨星演员我的冷艳总裁老婆人狐恋护妻霸婿我真不会打网球私生子我震惊了全世界女总裁的神级保镖最高使命华娱之流量影帝超时空评测无心法师:从挖出岳绮罗开始我去末世修个仙全球首富:神级再造系统我的梦幻年代东瀛大物
最早小说搜藏榜: 系统让我捡破烂从全能急诊科医生开始神豪:从百倍返利开始基建:开局给珠峰修电梯重生80:从收破烂开始!神豪:我能百倍返现我爸二婚送了我五个姐姐娱乐:从主持人大赛开始四合院之好好活着从情满四合院开始穿越重生之大收藏家灵气复苏:开局神级武魂娱乐:开局渣了杨老板从港片开始当幕后大佬从代工厂到科技霸主神话复苏:这个神明我认识重生过去的逍遥人生我的细胞变异了中医许阳黄金渔场我每周随机一个新职业神豪:开局购买力增幅百倍我被困在同一天一千年娱乐:开局一首海阔天空娱乐:开局喜当爹!高考结束成百亿神豪我在英伦当贵族高考以后,我才重生全球高武重生过去震八方从网络神豪开始神豪:开局骗了女主播!每168小时获得一个异能从签到获得商业大楼开始我有一个三界拍卖系统无限游戏:十倍奖励重生过去当传奇从大国机长开始亿万富豪从相亲系统开始末日:开局选择时间停止娱乐:巨星演员我,星空巨兽生活系神豪影帝从签到开始全球数据化,我能增幅万物娱乐:开局就和杨老板结婚医路坦途大时代从1983开始修仙从华娱开始万族之劫
最早小说最新小说: 文娱:让你唱歌,你搁这作法?四合院里的老中医地窟求生:开局食物增幅三十倍汽车公司?不,是国货之光再启仙途我的金融帝国热搜第一:叫你捡漏你开挂啊我写的娱乐文被杨老板看到了百元求生:从潘家园捡漏开始带着爸妈去上班娱乐:别联系了,真不熟放弃留学,我打造了世界第一名校从重生开始合租浪在娱乐圈四合院里的唯一老实人韩娱之隔世斑斓怪物食堂首富后才知是反派我的夫妻关系竟能数据化平行空间都市风水师大赌石乾哥传奇神眼少年全能天才混都市绝品全才十二生肖守护神都市无敌特种兵重生圣尊软玉温香极品黑道太子邪霸都市纯情校医校园纨绔特工我的美女上司冰帝校园行护花高手绝品小农民狱锁狂龙3之潜龙出海护花公子全职保安美女校花的贴身高手美女老师爱上我校园超级霸主官运之左右逢源黑客神医贴身美女攻略医道无双极品保镖美女老总爱上我