一张图弄懂协同过滤:如下面的GIF图所示,已知用户对部分商品的评价(好如不好),通过相似用户的行为可以推测用户对未知项的评价。
上图选自维基百科:ht...
问题:给定字符串,求其最长回文子串的长度。回文串是形如"aba", "abba"的对称字符串。例如:字符串“xabcbam”的最长回文字符串长度为5。
这个问题可以用动...
摘要:信息量/熵/信息增益/互信息/交叉熵
本文转自:http://www.cnblogs.com/zhangchaoyang/articles/2655785.html ,对机器学习相关的信息论基本概念做了...
百度大牛林仕鼎关于架构的分享《架构设计的一些思考by林仕鼎》
本文转自:http://www.kuqin.com/system-analysis/20111120/315148.html ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现,使...
研究数据挖掘和机器学习有一段时间了,对数据挖掘来说,商用软件有SAS、 Clementine、Oracle数据挖掘组件等等;由于个人学习和版权、算法定制等问题,开源的...
本文简单记录下代理软件Squid的安装和配置过程,方便以后查阅。
关键词: LINUX Squid 安装 账号 密码
1. 安装:
yum install...
本文简单介绍一种最基本的矩阵乘法的实现方法。
设有矩阵A(M×N)和矩阵B(N×K),令C=A*B, 那么矩阵C(M×K)的元素为:
其中Cik是C的第i行第k列的元素;Aij是...
通过ssh登陆其他机器时,需要手动输入密码,批量操作多台机器时,非常不便;而借助expect来设置自动输入密码,实现起来也略显复杂。
sshpass可以非常方便...
Glibc 2.9.93 qsort多线程下core dump分析
1 问题:
一个C实现的32位多线程服务在启动时core dump. 该服务运行了一年多,而此问题仅出现了一次,是一个比较...
文档的分值代表了该文档在特定查询词下对应的相关性高低,他关联着信息检索向量空间模型中的向量夹角的接近度。一个文档越与查询词相关,得分越高。分值计算...
摘要:朴素贝叶斯分类/文本分类
本文转自:http://www.cnblogs.com/zhangchaoyang/articles/2586402.html ,有例子+简单公式推导,介绍朴素贝叶斯的好文章...
问题:实现一个栈,要求含有函数push, pop, min,并且他们的时间复杂度都是O(1)。
解决思路:如图1所示,在普通栈的基础上,增加当前最小节点的指针curren...
一般的二叉搜索树(BST)在插入和删除数据的时候,直接在一定的位置添加和删除节点,没有应用使树
平衡的调整策略,树的高度不能得到有效控制,在极端的数据下...
本文内容是关于:平衡二叉搜索树,AVL Tree。
在《二叉搜索树(BST)的实现(C语言)》一文中,我们给出了一般二叉搜索树(BST)的实现。
BST在面...