信息检索论文IRGAN大一统信息检索模型的博弈竞争(彩标收藏版,附新闻及历史名人事件;欢迎赞赏、留言“阅读原文”下载PDF压包) 信息检索论文IRGAN大一统信息检索模型的博弈竞争(彩标收藏版,附新闻及历史名人事件;欢迎赞赏、留言“阅读原文”下载PDF压包)信息检索论文IRGAN大一统信息检索模型的博弈竞争(彩标收藏版,附新闻及历史名人事件;欢迎赞赏、留言“阅读原文”下载PDF压包)

信息检索论文IRGAN大一统信息检索模型的博弈竞争(彩标收藏版,附新闻及历史名人事件;欢迎赞赏、留言“阅读原文”下载PDF压包)

SIGIR2017三个StrongAccept论文IRGAN大一统信息检索模型的博弈竞争

SIGIR

满分论文背后的故事

二、纯经验知识、无实践的教学方式适合孩童教育吗?

(1311字)

三、新闻四则及历史上的名人和大事件

5588

i.早报,5月31日,星期三

ii.2017年5月31日周三读报!一切美好从“乐观”开始!

iii.2017年5月31日(丁酉鸡年五月初六)周三/早读分享:

iv.新闻早餐第4614期(文字版)2017年5月31日(星期三)农历丁酉年五月初六戊午日

v.2017年

日农历干支、节日、

历史上的今天

名人和事件

Appx.

数据简化

DataSimp社区译文志愿者(

600

GAN的启发下,提出IRGAN框架,通过极小化极大算法中的对抗性训练统一了生成式和判别式IR模型这两种信息检索方法学派。研究者在四个现实世界数据集上,对三个典型的IR任务(即网络搜索、项目推荐和问答)进行了广泛实验,在每组实验中都观察到了显著的性能提升。

介绍论文内容外,

介绍该

研究的缘起及研究背后中英两方团队的协作方式

,希望

的科研

带来启发。

作者:汪军

张伟楠等

第一作者汪军教授

伦敦大学学院(

UCL)长期做信息检索(IR)方面基础研究,他学生时代的导师是IR界的泰斗StephenRobertson(概率排序原则的发明人)和当前最有影响力的教授之一ArjendeVries。通讯作者张伟楠

该论文

实验,是汪军教授的学生,在上海交大任教。论文从提出设想

展开实验

团队迭代完成论文撰写,是中英双方团队通力协作的结果。

来源:

新智元首发

SIGIR2017

strongaccept

满分录取的论文《

IRGAN

:大一统信息检索模型的博弈竞争》(

IRGAN:AMinimaxGameforUnifyingGenerativeandDiscriminativeInformationRetrievalModels

数据简化

DataSimp

转发,本文已获作者授权

,附今日新闻四则及历史上的名人和大事件;

“阅读原文”

15k字9页彩标

收藏版

PDF文档。

1将在2017年8月7日-11日本东京召开的SIGIR2017年会海报

SIGIR2017三个StrongAccept论文IRGAN大一统信息检索模型的博弈竞争

信息检索

领域顶级学术会议

SIGIR2017,将于8月7日—11日在东京举行

华人研究者提交的论文《

IRGAN:大一统信息检索模型的博弈竞争》(IRGAN:AMinimaxGameforUnifyingGenerativeandDiscriminativeInformationRetrievalModels)以三个strongaccept的满分录取,高居362篇论文之首。

2IRGAN:AMinimaxGameforUnifyingGenerativeandDiscriminativeInformationRetrievalModels论文

本文提供了信息检索建模中两种思维流派的统一描述:聚焦于对

给定查询的相关文档

生成检索模型

,以及重点在于

预测查询文档的相关性

判别检索模型

。我们提出了一个博弈理论式的极小化极大算法来迭代地优化这两个模型。一方面,旨在从

标记和未标记数据中挖掘有效信号

的判别模型,为

生成模型

提供了指导,以适应在给定查询的文档上隐含的相关性分布。另一方面,作为现有判别模型攻击者的生成模型,通过最小化其判别目标,以对抗的方式,生成对于判别模型来说高难度的样本。

随着这两种模型之间的竞争,我们论证了,统一框架利用了两种思维方式:(

i)生成模型通过判别模型的信号学习适应

文档的相关性分布

ii)判别模型能够利用生成模型选择的未标记数据来实现对

文档排序的更优评估

。我们的实验结果展现出显著的性能优化,在网页搜索、推荐和问答系统等各种应用中,在

Precision@5和MAP上分别超越强基准算法23.96%和15.50%。

信息检索(

IR)

的典型方法是提供给定查询的

文档(排序)列表

。它具有广泛的应用,仅举几例,如

文本检索、网页搜索、推荐系统、问答和个性化广告

。谈到

IR理论和建模,一般认为有两个主要的思维流派。

经典的思维流派是假设在文档和信息需求(由查询可知)之间存在着一个独立的

随机生成

过程。在文本检索中,信息检索的经典相关模型聚焦在描述如何

从给定的信息需求生成(相关)文档

q→d,其中q是查询(例如关键字、用户信息、问题,取决于具体的IR应用程序),d是其相应的文档(例如文本文档、商品、答案),箭头表示生成方向。值得注意的例子包括Robertson和SparckJones的二进制独立模型,其中每个单词标记都是独立生成的,以形成相关文档。

文本检索的统计语言模型考虑从文档到查询的

逆生成过程:

d→q

,通常从文档生成查询词(即查询似然函数)。在词嵌入的相关工作中,词汇标记是从他们的上下文词汇生成的。在推荐系统应用中,我们还看到,可以从已知的上下文项目中生成

/选择推荐的目标项目(在原始文档标识空间中)。

现代的

IR思想流派认识到了

机器学习

的力量,并转向了从标记的相关判断或其代表事件(如点击或评级)中学习判别(分类)解决方案。它将

文档和查询

联合考虑为

,并从大量训练数据中预测其相关性或排序顺序标签:

q+d→r,其中r表示

相关性

,符号

+表示

特征的组合

。网页搜索的一个重大进展是

学习排序(

learningtorank,LTR)

,这是一系列机器学习技术,其中训练目标是提供给定查询(或上下文)的文档列表的正确排序。

学习排序的三个主要模式是

逐点的(

pointwise)、成对的(pairwise)和列表的(listwise)

。对于每个文献的相关性,逐点法通过学习,逐渐逼近人类评价出的相关性;成对法旨在从任何文档对中识别更相关的文档。列表法学习优化每个查询在整个排名列表上定义的(平滑)损失函数。此外,推荐系统的最新研究进展是矩阵分解,其中用户特征和项目特征的交互模式通过向量内积被利用来进行相关性的预测。

虽然信息检索的生成模型在为

特征建模(例如文本统计、文档标识符空间分布)

方面理论坚实,非常成功,但它们在利用来自其他渠道的相关性信号(如链接,点击等等)方面遇到了很大的困难,这主要可以在基于互联网的应用中观察到。虽然诸如学习排序的信息检索判别模型能够从大量的标记

/未标记数据中隐式地学习检索排序函数,但是它们目前缺乏从大量未标记数据中获取有用特征或收集有用信号的原则性方法,特别是从文本统计(源自文档和查询两方面)或从集合内相关文档的分布中。

在本文中,我们认为

判别检索

模型是同等重要的,就像同一枚硬币的两面。受机器学习中

生成对抗网络(

GAN)

的启发,我们提出了一个博弈理论式的

极小化极大算法

来结合上述两种思维方式。具体来说,我们为两个模型定义一个共同的

检索函数

(例如基于判别的目标函数)。一方面,

判别模型

pφ(r|q,d)

旨在通过从标记数据中学习来最大化目标函数。它自然地提供了超越传统对数似然性的生成检索模型的替代性指导。另一方面,生成

检索模型

pθ(d|q,r)

充当挑战者,不断地将判别器推向其极限。它为判别器迭代地提供最困难的情况,判别器通过对抗地最小化目标函数来重新训练自身。

以这种方式,两种类型的检索模型在极小化极大算法中扮演了比赛中的双方,都会在每一场比赛中努力提高自己以

“打败”对手。请注意,我们的极小化极大算法,和现有的博弈理论式的IR方法有根本性的不同。因为现有的方法通常是试图为用户与系统之间的交互建模,而我们的方法旨在

统一生成式

判别式

IR模型

在实践中,我们已经在三个典型的

IR应用中实现了提出的极小化极大检索框架:

网页搜索、项目推荐和问答

。在我们的实验中,我们发现极小化极大算法达到了不同的均衡,因此在不同的环境设定下,有不同的统一效果。通过逐点对抗训练,生成检索模型可以通过判别检索模型的训练奖励来显著提高。在

Precision@5上,和几个强基准相比,得到的模型在网页搜索中提高了22.56%,在项目推荐中提高了14.38%。我们还发现,通过新的成对对抗训练,判别检索模型在很大程度上得到了生成检索模型所选择的样本的推动,和所选择的强力算法相比,在Precision@5网络搜索上提高了23.96%,而在Precision@1问答任务中提高了3.23%。

方法简述

——信息检索(

GAN

我们提出的

IRGAN解决方案的总体逻辑总结在

中。在对抗训练之前,生成器和判别器可以通过其常规模型初始化。之后,在对抗训练阶段,生成器和判别器在等式(

5)和(3)中以另外的方式训练。

判别器和生成器是如何相互帮助的?对于

positive的文档,无论是否被观察到了,它们由

判别器

fφ(q,d)

条件概率密度

pθ(d|q,r)

给出的相关性分数可能在一定程度上正相关。在每个训练阶段,生成器试图产生接近判别器决策边界的样本,以对下一轮训练造成迷惑,而判别器则努力对生成的样本进行判别。由于在

positive但unobserved(即true-positive)的样本和(部分)观察到的positive样本之间存在正相关,和其他带有来自判别器信号的样本相比,生成器应该能够学习更快地上推这些positive但不可观察的样本。

——信息检索(

GAN

的一个训练示例

为了进一步解释这个过程,让我们用水中的肥皂打个比方,如

所示。在未观察到的

positive肥皂与观察到的positive肥皂之间存在着潜在的连接线(即正相关性),观察到的positive肥皂永久漂浮在水面(即判别器的判定边界)上。判别器起着将浮在水面上的未观察到的肥皂敲下水面的作用,而生成器充当选择性地将肥皂浮上水面的水。即使生成器不能完全适应条件数据分布,也仍然可能存在动态平衡,这是在水的不同深度下,positive和negative的未观察肥皂的分布取得稳定时获得的。由于未观察到的positive肥皂与水面上的观察到的positive肥皂相连接。因此总体而言,它们最后应该能够达到比(未观察到的)negative肥皂更高的位置。

实验简述

我们的实验对应于我们提出的

IRGAN的三个现实世界的应用,即

网页搜索、推荐系统和问答系统

。由于三个应用程序中的每一个都有自己的

基线算法

,所以我们的实验分为三个子部分。我们首先在网页搜索的单个任务中测试

IRGAN-pointwise

IRGAN-pairwise

;然后在排序偏差不太关键的项目推荐任务中进一步对IRGAN-pointwise进行了研究。我们又在排序偏差更为关键(通常只有一个答案是正确的)的问答任务中对IRGAN-pairwise进行了测试。

在本文中,我们提出了

IRGAN框架,通过在极小化极大算法中的对抗性训练来统一两种信息检索方法学派,即生成模型和判别模型。这种对抗性训练框架利用了两个学派的方法学:(i)生成式检索模型受从判别检索模型获得的

信号引导

,这使得它比非学习方法或最大似然估计方案更有利

;(ii)可以通过策略性地让生成器的提供negative样本,增强

判别式检索

模型,从而更好地为文档排序。总体而言,

IRGAN提供了一个更加灵活和有原则的训练环境,结合了这两种检索模型。在四个现实世界数据集上,对三个典型的IR任务(即网络搜索、项目推荐和问答)进行了广泛实验。在每组实验中都观察到了显著的性能提升。

GAN的实践取得了巨大的成功,但仍有许多问题需要研究人员回答。例如,现在还“不完全清楚”为什么GAN可以产生比其他技术更清晰的逼真图像。我们在提出的IRGAN框架中对信息检索的对抗性训练的探索表明,根据任务和设定,最终可以达到不同的均衡。在IRGAN的逐点(pointwise)方法版本中,生成检索模型比判别检索模型得到了更多改进,但在IRGAN的成对(pairwise)方法中我们得到了相反的观察。这肯定有待进一步研究。

未来,我们将进行更多的基于实际数据集的进一步实验。我们还计划扩展我们的框架,并对词标记的生成进行测试。一个可能的研究方向是探索从

IRGAN生成检索模型中学习词加权方案,然后在此基础上导出新的特征排序。此外,语言模型可以随着GAN训练重新定义,其中可能会出现新的有用的词模式。

SIGIR

满分论文背后的故事

生成式和判别式,信息检索两大学派

信息检索界一直有两大学派。经典的方法以生成模型为主,大名鼎鼎的

概率排序原则(

ProbabilisticRankingPrinciple)

搜索语言模型(

IRLanguageModel)

,以及汪军教授(本文的第一作者)的

组合排序原则(

PortfolioRankingPrinciple)

,其实都是需要生成模型具体量化每个文档对检索关键字的相关度。受机器学习影响,近年有利用大量数据集,通过判别模型训练排序的方法,其中包括,

learningtorank和神经网络的方法。但是两大学派都有优缺点,怎样提供一个大一统的方法一直是没有解决的问题。

2012年的9月底,张伟楠提着行囊远赴

英国伦敦

汪军教授处求学。汪军教授在

伦敦大学学院(

UCL)

长期做信息检索(

IR)方面的基础研究,他学生时代的导师则是IR界的泰斗StephenRobertson(概率排序原则的发明人)和当前最有影响力的教授之一ArjendeVries。

其实关于

IRGAN的大致思想,汪军和张伟楠很早就已经讨论过。因为通过生成器作为一个很强的带策略的负采样器,肯定能够帮助判别式的排序模型提高头部文档的排序效果,这个现象在他们撰写一篇SIGIR2013的文章时,两人就已经明确发现。GAN出来以后,汪军一注意到这个对抗训练框架,就立马想到GAN可能用来帮助生成式的IR模型

直接挑选文档(不用做文档排序)

,甚至生成新的文档,从而达到了统一生成模型和判别模型的目的。不过这个点子一直处在初步思考中,并未成熟。

中英团队的合作速度

2016年12月初,已经在上海交大任教的张伟楠突然接到汪军的电话,此时他远在西班牙出席当年的

NIPS

,听了

IanGoodfellow的GANtutorial

。一时间,关于用

GAN来融汇IR界的两大派别的解决方案清晰地出现在他的脑中,并且推导出来。理解了IRGAN的思路之后,张伟楠立即聚集了交大

致远工科

的大三学生于澜涛和计算机系研三学生龚禹开展实验工作。龚禹其实已经加入

阿里巴巴

徐盈辉博士的研究团队。为了能加强交流,张伟楠直接让他俩搬进了自己的办公室,开始了快速迭代开发。后来汪军又联系了天津大学的张鹏教授和他的学生王本友加入项目,团队兵分三路分别在网页排序、个性化推荐、问答系统方面验证

IRGAN的有效性。而在英国的汪军和DellZhang教授则着手开始论文的撰写工作。

汪军说:

“现在做计算机的研究再也不能单兵作战了,需要一个

强大的团队

做支撑,

工程和数学

都要擅长。我不得不说,我们中国研究团队是十分优秀并且令人佩服的。于澜涛和龚禹同学之前都已发表过

AAAI论文

,而王本友同学也在

IR领域有多篇

SCI

CIKM

论文。这些科研经验让他们在快速迭代

IRGAN的实验中做出了更好的判断。更让我感到吃惊的是,他们的工作勤奋到令人不敢想象的程度。正是因为他们的勤恳,IRGAN繁重的实验工作才能在

内全部完成。

伟楠补充道,

“作为小老板的我们也丝毫没有懈怠。我和澜涛龚禹朝夕相处,

快速迭代实验开发

以及论文的撰写。徐盈辉博士则直接从杭州赶到上海交大和我们详谈了论文和实验的每个细节。在无数次电话会议中就明显感到,徐博士是

hard-core的IR资深研究者

,在建模方面为我们出了很多力。天大张鹏教授长期研究

IR和QA方面的课题,他保证了QA这一路的实验推进顺利,并和我们配合修改了论文。”

SIGIR的截稿日期在1月25日,两天后就是大年除夕。在拼到最后几天的时候,校园里早已是人去楼空,学生们开始有些急躁,张伟楠则和他们在交大咖啡厅喝下午茶,忙里偷闲地把心静下来。而张鹏教授则直接帮学生买好了回家的机票,让他们没有后顾之忧。

汪军说,

“中英团队之间的8小时时差对我们快速迭代是有利的,英国的工作在深夜结束后,直接提交给中国的团队(已经是中国的第二天清晨)。中国的团队结束后,又可以交给英方。我们基本上是24小时不停的快速迭代,保证工作的质量和速度。”

团队在

bitbucket

上面提交论文的

latex

整个团队

8个人在

bitbucket上面提交论文latex修改

,借助

git强大的修改merge功能,我们总是能多人并行迭代论文工作。在最后的1月24日那一天,我们的提交次数就超过了200次,这个项目的总提交数则在550次。

论文接收与后记

2017年4月的一天,IRGAN论文以三个strongaccept的满分录取,高居362篇论文之首。IRGAN的微信群自然也是欢声笑语一片。

IRGAN的成功录用只是研究的开始。之前汪军和张伟楠课题组已经合作发表了一篇

生成离散文本序列

SeqGAN

工作。汪军说:

“GAN算是一个

双智体

群体智能,以

为主。我们之前在离散数据的判别和生成方面有一定的研究基础。离散数据的生成方面很可能需要借助

强化学习

,这激发我们往多智体强化学习方向进一步探索。

二、纯经验知识、无实践的教学方式适合孩童教育吗?

(1311字)

秦陇纪

10言

无真实实践的

纯经验

和理论教育

人类认知

,但可以提高

知识储备

。孩童在日常生活中

语言文字

,可以

了解各种

现实世界的实践和体验

。学校简单地用

纯经验知识、无实践

纯文化

的教学方式

教育一个孩童,

受影响:对真实世界的认知、自身情感的体验,会形成

思想层面

记忆性

为主的思维和习惯

;未来将很难有

自主认知能力、创造性

,面对社会真实事物,得重新建立认知,比

实践过来的人

面对更大的挫折,甚至

成年后

一生都无法转变已经习惯了的

“空想空谈”

纯想象

长期脱离实践和实际社会搞纯经验知识教育,对人有

副作用。现实社会里,实质工作只有

20%左右,

一生都在空想空谈发空文者

80%左右,给人民造成了负担。究其原意,就是从幼儿园起,到走出学校,基本习惯了只会想象,到

做事时

,大家发现除了五花八门的各种想法、设想、理论,基本的实践和应用却做不来!根源在于

经验知识为主的教育

,让人习惯了

思考和写作

实践实验操作能力被阉割了

,以至于走出学校,依然

习惯了空想空谈,发表文章也是空洞的说教、理论、想法、评价、访谈之类的

。由于做事的权力从小就被阉割,真想做事,已经做不来了。这就是我国

脱离社会实际生产生活的教育

造成的

最严重后果

还不警醒?教育人脱离

历史、社会、趋势

不甚了解,

在所谓的

“教育学术界”

“文化知识范围”

“教育

教学教研

,甚至很多人把

书本和文学

当成了教育

。那些当官的、成功的,都是早都看穿了的人,只剩下钻

学校教育牛角尖

的教书匠固执己见、在已经

脱离实际很远的课堂教学上翻来覆去搞各种花样继续残害孩童

。试问,一个连

家人、邻里、社区、单位基本常识

自然世界、民族

都没充分接触过,手无

缚鸡之力、不能做人类技能传承者

的书生,受

应试教育

后将去做什么?

类似地方领导习惯了

土地财政

GDP严重依赖

房地产和基础设施

,真想发展科技、提高社会各部门效能、走向

信息化、自动化、

智能工农业

,已经不懂得怎么

落地操作、无人可用

,只好延续旧思路、裹足不前了。

思想意识玩家、政府闲官员、伪学者、行业骗子、纯资本家、广告商、脱离社会实际、外行领导内行的人

,无所谓谁是实干的、实干的是谁,干不干都

耍嘴皮子、玩文字游戏、满脑子理论知识、搞关系为生的人

负责,他们只搞社群组织或坐收渔利。但喊口号、讲理论也是必不可少的。

氛围、凝聚力、目标

,喊喊口号只是

中最简单、最先的一步,达成了认识、大家都知道做了,这个时候需要真干事的人。如果

把事情做成

可分为十个阶段或十等份

,那么,

动动嘴皮、喊喊口号

只是前面的一份,

能占五六份,找对方法

做成、优化

能占两三份,最后一份是大家

认可、使用

才能算做成了。

我们要

大步往前走,要做

具体的生产实验研究

,不停留在

低级肤浅的思想意识或文字口号

对于人才的培养,绝不可像过去条件所限采取

过分简单化搞教育

;更不可把

大学及研究生层次的教学

,搞成

教书本和考试

。对于科研,不能拿发文章的数量来衡量,学术文章脱离了

社会和产业

,彻底玩弄概念和理论,还有什么作用;真的有价值的东西能是发文章的吗?要实干,要做成一个环节、一个阶段的事情,需要更有效的管理体制。

三、新闻四则及历史上的名人和大事件

5588

,5月31日,星期三

1、香港媒体曝料孔令辉被新加坡赌场

256万港元

一事,引起广泛关注,乒协

:暂停孔令辉教练职务立即回国接受调查;

2、北京

中介机构

“劝降”房价

:不接受业主将在平台上消失;

3、韩国业界29日有消息称,

乐天玛特

方面计划抛售长期亏损的

20-30家店铺,目前正与中国当地企业协商;

4、大陆客在台湾买房限一人一户台网友:放宽陆资赴台买房将炒高台湾房价;

5、4套萨德发射车秘密入韩韩媒:文在寅惊悉要求彻查;

6、中国

电价下降

1分1

节约全社会用电成本

350亿元;

7、今年3月以来,已有近60城出台超150次调控政策,北上广深租金首降;

8、美国白宫新闻主任麦克-杜布克(MikeDubke)已正式辞职,此时离美国总统特朗普对其的任命仅仅三个月;

9、新华社再评

证监会减持新规

(新规限制的主要是那些解禁期一到就迫不及待大幅减持的行为):赚快钱投机老套路不灵了;

10、美情报公司称勒索病毒或由华人黑客撰写,因软件“中文地道”;

11、出于安全考虑,美国或对所有出入境航班下达“笔记本禁令”;

12、澳大利亚将禁止性犯罪者出国旅游,外长称意在保护东南亚儿童;

【心语】滚石不生苔,转行不聚财!

ii.

2017年5月31日周三读报!一切美好从“乐观”开始!

1、国家旅游局发布的《

革命推进报告》显示,从

2015年初到2017年4月底,中国共完成新改建厕所52485座,占厕所革命3年计划(共5.7万座)的92.71%。

2、亚马逊数据显示,

户外运动

已经成为新的网购消费增长点,并主要呈现出三大消费趋势:户外装备轻量化概念受推崇;户外消费向国际化和专业化进阶;智能化引领户外运动新风尚。户外运动产品十大购买力城市依次为北京、上海、广州、深圳、成都、南京、杭州、武汉、天津和苏州。

孔令辉

“赌场追债事件”被暂停中国女乒主教练职务。中国乒协回应孔令辉涉讼:其相关行为已经严重违反国家公职人员管理相关规定和纪律要求。决定暂停孔令辉中国女乒主教练工作,并深刻反省,立即回国接受进一步调查和处理。孔令辉日前正带队参加杜塞尔多夫世乒赛。

4、《消费者报告》最近对

83,000名电脑用户

的一份调查显示,苹果笔记本电脑的

“破损或不工作”几率最低(17%)。而三星的表现则属第二好,“破损或不工作”的几率为27%;戴尔29%排第三,惠普30%排第四,联想31%排第五,华硕33%排最后。

5、北京市食药监局公布北京市食品安全监控和风险评估中心对97个“五毛零食”样本的“脂肪”、“钠”和“甜蜜素”专项营养含量测定结果:7成调味面制品检出“甜蜜素”,“五毛零食”呈现油盐甜“三高”,对少年儿童健康成长不利。截至目前,北京共下架6100公斤存在风险隐患的“五毛零食”。

6、北京查获桶装水黑窝点:用井水充名牌。现场发现“燕京”“娃哈哈”“京领山泉”“屈臣氏”“香山时节”“雀巢”“太平清龙泉”“乐百氏”“香山龙井”等10余种,商标标识近万张。该生产加工窝点无字号,无营业执照及生产加工许可资质,负责人现已逃逸。

7、劳斯莱斯公司推出世界上最贵的车型Sweptail,准确价格不详。然而,据各种估计,这款车的价格可能高达1700万到2000万美元。劳斯莱斯Sweptail上周末亮相意大利Concorsod'Eleganza车展,该款车仅此一台。

8、美联储报告:尽管美国家庭总体状况“略有”改善,仍有将近三分之一的美国人感觉财政困难。此外将近一半的美国人(44%)表示,无法承担400美元的额外支出,除非变卖财产或者借贷。

9、俄科研人员从

国际空间站

外表面提取了多份样本,结果发现了

6种微生物的DNA(脱氧核糖核酸)片段

1种真菌的孢子和1种能在太空生存的细菌,其中部分可能来自地球。

10、4套萨德发射车“秘密”入韩,文在寅要求彻查。据韩国媒体消息,韩国总统文在寅30日听取“萨德”相关报告,得知除部署于庆尚北道星州的2辆“萨德”拦截弹发射车外,其后又有4辆发射车被暗中运入韩国境内。文在寅表示震惊,并指示青瓦台国家安保室长和民政首席秘书彻查真相。

11、朝中社报道称,在金正恩指导下,朝军成功试射搭载新开发的精密制导系统的弹道导弹,为确保远程观测,此次试射将目标射程定为中程,下落地点距离目标点仅7米,命中准确。(金正恩去年下令开发“朝鲜式弹道火箭”,攻击“敌人舰艇”等海上、地上的精确目标,精密制导弹道导弹便是其中一环。)

12、苦乐一念间,会快乐其实是一种能力。学会随时发现生命中那些美好的事,自由自在,不藏不掖,相信一切都是最好的安排。

美好一天从

“乐观”开始!

iii.

2017年5月31日(丁酉鸡年五月初六)周三/早读分享:

1、【

中国电价

每度下降

1分1】国家电网消息,已经征收50多年的城市公用事业附加费被取消。按全国销量计算,可节约全社会用电成本约350亿元。居民用电缴费单里,有七项"附加"费用,包括城市公用事业附加费、国家重大水利工程建设基金、水库移民后期扶持基金、农网还贷基金等六项向用户直接征收。

2、【

北京二手房价

大面积下跌

部分区域跌幅达

20%】5月份,二手住宅市场实际销售环比4月份同期下降34.2%,城8区的成交均价都在下降,跌幅最大的是通州区、亦庄开发区,幅度超过20%。

3、【北上广深房租首降金融危机以来首次出现】上海房屋租赁指数办公室的数据显示,上海市房租指数结束了连续90个月的上涨行情,从今年1月开始延续下跌的态势。北京、广州、深圳的租金也在持续下降。分析认为,成交冻结,部分业主转售为租,使房源供大于求,带动了租金下行。这应该只是一个开端,楼市成交冻结对租金的影响将持续显现。

4、【李嘉诚请阿尔法狗之父给自己"上课"】26日他在香港邀请Demis和Mustafa两人,讲解人工智能研究方向与各种应用的阶段成果。

5、【中金公司与潜规则事件高管解除聘用关系】中金公司首席分析师黄洁被中金公司通报开除。此前有人爆料称,多名

实习女生遭其暗示性潜规则

6、【孔令辉被暂停教练职务回国接受调查】此前孔令辉被新加坡一家赌场诉至香港高等法院,追讨250多万港元贷款。

7、【海通证券:减持新规和IPO发行规模减小有助改善股市微观资金供求和投资者情绪】2638点以来的中期震荡市格局不变。逐步布局期,看好消费和白马成长等一线龙头、金融,关注国企改革。

8、【美国达拉斯联储主席:预计今年还有两次加息】预计美联储今年将宣布资产负债表缩减计划。应该逐渐退出宽松政策。未见市场出现泡沫,企业利润增速基本上是积极的。债券市场预示着经济增长前景疲弱。

9、【阿里成二股东联华超市股价暴涨】上海易果电子商务拟出售其持有的18%联华超市内资予阿里巴巴,阿里将成为联华超市第二大股东。受此影响,联华超市开盘大涨27%,至收盘,股价上涨24.44%,报3.92港元。

10、【仙言潮声】选择低调是为了生活在自己的世界里,选择高调是为了生活在别人的世界里。低调是超越,高调是升华。

美好的一天从低调做人高调做事开始!

iv.新闻早餐第4614期(文字版)2017年5月31日(星期三)农历丁酉年五月初六戊午日

每天三分钟

知晓天下事

今天是世界无烟日

A、【国内】

1)李克强总理5月31日至6月2日正式访问德国并举行中德总理年度会晤、赴布鲁塞尔出席第十九次中国-欧盟领导人会晤、对比利时进行正式访问;

2)“光盘行动”开展4年,消费者的自觉行动正在形成;

3)[法制与反腐]中纪委机关报批部分

干部耍官架子

:动不动吆五喝六;疯狂刷支付系统漏洞窃取

1300万元,其中400多万打赏网络女-主-播,淘宝店主胡某获刑15年;

4)外来工从此不必“告老还乡”:深圳迎来首批在深退休外来工,每月都有一份养老金自动打入账户;

5)人社部:企业退休人员月人均基本养老金达到2362元,较2012年增长了676元,年均增长8.8%;

6)郑州退出记分制治渣土车,分数扣完将取消清运资质,超载、超速、为环境“增灰”的渣土车这次真的要玩儿完了;

7)山西汾西县双语学校部分师生呕吐腹泻,疑似诺如病毒感染,疫情已得到有效控制;

8)[军事]中国唯一培养航母舰载机飞行员的院校亮相,海军航空大学将由海军航空兵学院和海军航空工程学院重组而成;解放军坞载小艇自热食品PK丹麦24小时军粮;

9)[港澳]庆祝香港回归20周年,粤港交流主打文化牌;要求高,待遇好,受尊敬,澳门:从警是个好选择;

10)[台湾]大陆11所佛学院代表组团访台开展教育交流;陇(甘肃)台企业家联合办医,造福更多民众;台湾统派人士李承龙连续砸毁日据时期雕像被捕;民进党元老:蔡英文是傀儡,台湾3到5年内会有动乱。

B、【国际】

1)中菲两国联合破获特-大-走-私-毒-品-案,查-获-冰-毒-604公斤;

2)美专家:市场对特朗普经济政策乐观情绪有所降温;

3)朴槿惠第三次出庭受审,否认了检方全部指控,坚称无罪;亲信干政主角崔顺实女儿将从丹麦出发,5月31日抵达韩国;4套萨-德发射车暗中入韩,文在寅惊悉后要求彻查!

4)美军增加10亿预算,推进核三位一体现代化和置换;

5)外媒:印度欲禁止中企投资电网,宣称要以此“展示实力”;

6)法国戴高乐将军墓遭破坏,马克龙知情后情绪激动;

7)缅甸第二届21世纪彬龙会议代表签署联邦协议;

8)土耳其总统一声令下,全国足球场纷纷易名,由“竞技场”改为“体育场”;

9)美国科学家新发现了一种抗体,新抗体有助于增加骨量减少体脂,并能推动治疗骨质疏松症和肥胖等疾病相关药物的研发。

C、【财经证券】

1)银行备战6月末考核:部分银行定期存款利率上浮50%;

2)江苏1-4月房地产投资增速同比增9.8%高于全国;

3)险资:最近几年优先投资大蓝筹,多数小盘股已无稀缺性;

4)1135家上市公司预告中期业绩,170家增幅翻倍。

D、【文教体娱】

1)浙江新高考试点:学生有35种选择打破文理分科局限,较好地激发学生的学习兴趣;

2)中国唯一艾滋病患儿学校-山西临汾红丝带学校16名高中生迎来毕业季;

3)北京奥方星全外教幼儿园黑人外教打孩子被开除,幼儿园资质受质疑;

4)应丹麦驻上海总领事馆邀请,凤凰旅游赴丹麦生蚝节传播“中华蚝味道”;

5)J马成恒大引援最大败笔已成事实,现因新政或加快被清洗;

6)体育总局:严肃查处孔令辉问题,对违法违纪零容忍;乒协回应:暂停孔令辉职务,立即回国接受调查;女乒遭致命打击,孔令辉被停职反省,日本偷笑逼刘国梁出手救女乒;

7)亚冠:恒大客场1-2负于鹿岛,但两回合总比分2-2,依靠着客场进球多的优势晋级八强。

E、【生活服务】

1)京津冀将联合制定食品安全地方标准,完成食品安全企业标准备案系统升级;

2)沪少儿图书馆新馆筹备新馆,全市征集“金点子”;

3)广州地铁十二号线将实现无人驾驶;

4)甘肃明确年度医改重点任务,包括完善分级分工制度,开展病种动态管理,建立多种形式的医联体,实施家庭医生签约服务,提高县级医院服务能力;

5)陕西卫生计生执法“双随机”,检查对象和执法人员随机通过系统产生。

F、【健康养生】

1)夏季虽然很热,但是我们也不能总是吃冷饮,穿衣服的时候最好不要露腰腹,不要总是吹空调,吃蔬菜要煮熟了吃等,多吃一些薏苡仁、大枣等对脾胃好的食物。

2)桂圆吃多会上火,每天吃多少合适:正常新鲜的桂圆一天吃200克左右,带壳的干桂圆一天吃20多个,假如是桂圆肉的话,8到10个就差不多了。

(编辑:西安知非

自新华、中新、腾讯、凤凰、东方财富网)

v.2017年

日农历干支、节日、

历史上的今天

名人和事件

2017年5月

1日是世界无烟日,吸烟有害健康,吸烟还是心脑血管疾病、癌症等病的重要诱发因素,吸烟伤害自己的同时还回伤害到身边的人。

2017年5月1日是

、出生名人呢?订阅、

秦陇纪

10公众号哦。

2017年

日节日

5月31日是5月的最后一天,也是阳历年的第151天(闰年是152天),离一年的结束还有214天。

2016年5月31日节日:

世界无烟日

、圣母访亲节、地毯节、中国

国际汉字文化节

、南非共和国日、天神祭。

2017年5月31日

公历:

2017年5月31日星期三

农历:二〇一七年

五月小

初六日

回历:

1438年9月5日

干支:丁酉年

乙巳月

戊午日

八字:丁酉

五行:山下火

佛灯火

天上火

桑柘木

生肖:属鸡

星座:双子座

星宿:张宿

(张月鹿)

值神:青龙

(黄道日)

冲煞:马日冲

(壬子)鼠煞北

2017年5月31日星座

双子座

(5月21日-6月21日)

5月31日性格:5月31日出生的人通常给人强悍、冷酷的印象。事实上,只要多接近他们,便会发现这些人其实比想象中更友善、情感更丰富,有时甚至还很容易心软。平时他们面对世人的假面具,是用来隐藏内心的缺乏安全感,或是童年的创伤。

5月31日出生名人

1162年——

孛儿只斤

·铁木真

,蒙古帝国可汗。

1810年——

沃尔特

·惠特曼

诞生,美国著名诗人,代表作《草叶集》。

1835年——土方岁三,日本幕末新选组副长。

1868年——袁吉六,教育家。

1906年——

罗瑞卿

,中国无产阶级革命家、中国人民解放军高级将领,军事家,开国十大将军之一。

1912年——

吴健雄

(1921-1997)

,著名的实验物理学家。

1930年——克林特·伊斯特伍德,好莱坞演员、导演。

1945年——宁那·华纳·法斯宾德,德国导演、演员、话剧作家,新德国电影的代表人物

1965年——演员波姬·小丝(BrookeShields)生于美国纽约。

1966年——八神健,日本漫画家。

1980年——安迪·赫里,美国朋克乐团打倒男孩(FallOutBoy)的鼓手

1983年——陈妍希,台湾著名女演员,、主持人

1987年——同人歌手yanaginagi(やなぎなぎ)出生

1989年——德国足球运动员马尔科-罗伊斯出生

1984年——内特·罗宾逊,NBA俄克拉荷马雷霆队球员

1990年——谭松韵,大陆女演员

5月31日历史大事件

1678年——英国考文垂根据戈黛娃夫人裸体骑马游行

为市民争取减税的传说

设立了首个纪念日。

1926年——理查德·伯德和弗洛伊德·贝内特乘飞机

环绕北极飞行

成功。

1936年——

全国各界救国联合会

在沪成立。

1945年——第二次世界大战:

台北市遭到盟军大规模空袭

,造成

3000余人死亡。

1961年——南非退出英联邦,成立

南非共和国

1966年——陈伯达率领工作组到人民日报社夺权。

1982年——英阿为争夺福克兰群岛爆发大海战。

1986年——第十三届世界杯足球赛开幕。

1998年——

苹果公司发布

iMac微机

2004年——

百度汉服吧

2010年——国家发展改革委发出通知,决定自6月1日零时起

将汽、柴油价格

每吨分别降低

230元和220元。

根据相关数据说明:每年全球因为吸烟死亡的人数有

250万,所以吸烟真的会危害到自己的身体健康。

Appx.

数据简化

DataSimp社区译文志愿者(

600

数据简化

DataSimp

”社区翻译组、媒体组

缺少志愿者,当下需要:

①设计黑白静态和三彩色动态社区LOGO图标;②翻译

IT大数据、人工智能、编程开发技术

文章的至少投一篇高质量首译美欧数据科学技术论文,正式成为

数据简化

DataSimp社区贡献者

。非诚勿扰,季度无贡献者自动退出。加入

数据简化

DataSimp社区

,请在公号后台留言,或加

QinlongGEcai(请备注:姓名-单位-职务-手机号)微信。

社区筹备详情,请阅读本公号文章

《科研江湖中的一眼清泉之数据简化

DataSimp社区及学会》

DataSimplificationandSciences

WechatandToutiaoPublicAccount

QinDragon2010@qq.com

2017.

31Wed

Shaanxi

China:

LIFE

Lifebeginsattheendofyourcomfortzone.--NealeDonaldWalsch

THEDAY

Thestrengthofpurposeandtheclarityofyourvision,alongwiththetenacitytopursueit,isyourunderlyingdriverofsuccess.--RagyTomas

长按下面二维码

“识别图中二维码”关注

公众号:

数据简化

DataSimp

(搜索此名称也行)。

秦陇纪

70s

),科普家、

IT老师、硕士

数据简化

DataSimp新媒体(筹技术、社区、期刊)创始人,

研究方向:

教育技术、大数据、

人工智能、知识工程,数据挖掘

信息抽取

、数据简化、

知识库构建。

欢迎高质量大数据、人工智能、知识工程、自然语言处理领域研究者给

“数据简化DataSimp”社区投稿;或贡献数据采集、处理、分析、简化、应用各环节开源代码。

(西安

秦陇纪

10数据简化DataSimp

汇编,欢迎有志于

数据简化

之传媒、技术的伙伴加入全球

“数据简化DataSimp”社区!转载出处:

秦陇纪

10数据简化DataSimp

数据简化

DataSimp

Sciences

”汇译编,

投稿邮箱

QinDragon2010@qq.com

赞赏;

“阅读原文”可下载:

PDF论文

附录新闻

=压缩包

版权申明: 本站文章来源于网络或网友自行上传,如果有侵权行为请联系站长及时删除。

赞 ( 1) 打赏

评论

9+4=

此站点使用Akismet来减少垃圾评论。 了解我们如何处理您的评论数据