新华书店的一道数学题-尊龙官方平台

新华书店的一道数学题

el/2024/3/25 17:45:21

    今天去新华书店,去翻查一本在意了很久的书,第一次深刻的认识到在新华书店确切的找一本书是多么的困难。

    首先在书店电脑上查这本书,获得这本书的详细信息,包括分类,作者,出版社,编号。这里我们假设分类是经济,新华书店的经济分类十分诡异,囊括了经济学原理,市场营销,企业管理,通俗读本(股票,金融,房地产),口才,心理学,每一各分类大概有5-8个书架,每个书架400本书左右。单从整个问题解域来看,找到这本书的概率0.01%一下。那么要做的就是缩小解空间,假设解域为s(a1,a2,a3,a4,a5..an..),a为分类的子解域。

     在新华书店中,首先无法通过电脑准确定位一本书的位置,其中书目的详细信息中,能够使用的信息只有分类和出版社信息。我要找的书名《影响力2》,中国人民大学出版社。这里问题就来了,我只知道书名,并不知道这本书属于什么分类。确切的说,放在很多分类下边我都觉得不为过,问题x∈ai||x∈aj...||x∈an为真(||为程序符号“并”,这里不讨论书店的查找策略有多么的龌龊,并假设我找不到这本书,则工作人员也找不到这本书),求解在最短的时间内我成功找到这本书的概率p(x)

      为了简化问题,这里我可以认为找到了正确的分类,就相当于找到了这本书,问题简化为

 使概率p( x的实际分类| 预期分类 )最大,即p( ax| ak )的最大概率, 1≤k ≤n

根据贝叶斯条件概率公式

p( ax|ak )= p( ak|ax )*p( ax )/p(ak)

p(ak)为不变量,则有

p( ax|ak ) ∝ p( ak|ax )*p( ax )

p( ak|ax )为相似度,p( ax )为先验概率

这里的先验概率亦为不变量,p( ax ) = 库存/总书目

取决于p( ak|ax ),这个相似度可以采用朴素概率法来计算(这个名称有待商榷),在书店查询系统中,查找带有影响力关键字的书目,在样本中统计所有出现分类的概率,即可获得p( ak|ax )

我们可以看到先验概率p(ax)已经为0.01%一下,p( ax|ak ) < 0.01%

根据小概率事件原则,即便是排除所有的人为因素,我们可以认为在新华书店中找到一本只知道名称的书是不可能的事情。

 求证完毕。

参考资料:

数学之美番外篇:平凡而又神奇的贝叶斯方法

http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/

数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用

http://www.google.com.hk/ggblog/googlechinablog/2006/04/blog-post_1583.html


http://www.ngui.cc/el/5127356.html

相关文章

从二项式定理想到的

从word2010转换过来十分麻烦,所有的公式都要变成图片,干脆直接上全图好了的,欢迎大家讨论指正。 最后那段:告一段落,推荐傅立叶分析视频,这个老师真的很有想法 http://v.youku.com/v_show/id_xmtaxmjuzod…

关于测试驱动开发的思考

关于测试驱动开发的思考 测试驱动开发(test driven develop)作为敏捷思想的重要组成部分,将开发和测试在同一时段完成,我认为是一个很不错的想法,尤其是经历了无数测试后的返工以及开发中的疏漏后,测试驱动…

重新理解动态规划的切入点

重新理解动态规划的切入点 动态规划(dynamic programing)这里我们不讨论能做什么,或者该如何优化,只讨论从分析的角度看动态规划是什么,如何切入建立基本模型。 动态规划是对于一个系列的决策问题提供寻求最优解的方法…

算法回归-矢量模型与排序算法(引子)

算法回归-矢量模型与排序算法 通过矢量模型进行排序算法的思考: 排序算法不管是堆排序,桶排序,快速排序,及其各种优化,主要目的是减少比较的次数和对于特定环境的应用。 矢量是线性代数以及空间几何中重要的理论依据,其主要性质在图形学领域应用颇广,向量ab同时代表a到b的…

8月25日通过mba写下的 - 乔布斯与我们

今天是一个时代的终结,乔布斯会以怎么样的心态面对这次辞职,或者说他目前以什么样的身体状态来做出这样的决定,我无从得知,也并不关心。是的,我不是来唱挽歌的,我相信这条路乔老爷子还会走得更远࿰…

ceo的职责

ceo的职责 这里为了给在这个岗位上工作的人们,一些建议,和自省的依据。 ceo的职责是什么? 首先ceo是一个责任岗位,并没有权力,他的职权是在执行责任中才存在,同时ceo的职责因他服务的对象不同而不同。 ceo的是连接外部…

coding的极致

技术的象牙塔 架构师,算法研发工程师在工程师圈内是受人尊敬的,学生时代所受到的熏陶使得我对这些角色有天生的认同和敬畏感。 一开始的架构师是模糊的,第一感觉是对各种设计模式的掌握,行云流水的设计图。当体会到架构师这个角色…

产品是颗洋葱(一)

产品是一颗大洋葱,层层叠叠,简单的外衣有着意想不到的层次,有时候又有着越剥越让人流泪的感觉。 洋葱最外层是需求,是商业价值的朴实的表达,它的营养价值远比它的外观重要,同时它需要有包容性,有…

关于exponential family

exponential family 在回归算法,聚类起到重要作用,并为glm(generalized linear model )提供了基础 可以将伯努利,泊松,伽马,正太,狄克累分布等等常用分布都展现成的形式 其中theta作为参数 例如 可被分解为…

idea设置主题

idea主题资源地址:https://github.com/guobinhit/intellij-idea-tutorial/tree/master/resources/idea-theme 以「geditforelegantgnome」主题为例 下载完事之后再idea里打开那个jar 然后会提示你需要重启idea,这里点击确定重启idea 重启后如下操作&…
网站地图