类别归档:他山之石

他山之石,可以攻玉。

RSS feed of 他山之石

推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure)

下面简单列举几种常用的推荐系统评测指标:

1、准确率与召回率(Precision & Recall)

准确率召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中精度是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率;召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率

一般来说,Precision就是检索出来的条目(比如:文档、网页等)有多少是准确的,Recall就是所有准确的条目有多少被检索出来了。

正确率、召回率和 F 值是在鱼龙混杂的环境中,选出目标的重要评价指标。不妨看看这些指标的定义先:

    1. 正确率 = 提取出的正确信息条数 /  提取出的信息条数   ...

继续阅读

Python程序员常犯的10个错误

原文链接:http://www.toptal.com/python/top-10-mistakes-that-python-programmers-make

BY MARTIN CHIKILIAN - SENIOR SOFTWARE ENGINEER @ TOPTAL

About Python 关于Python

Python is an interpreted, object-oriented, high-level programming language with dynamic semantics. Its high-level built in data structures, combined with dynamic typing ...

继续阅读

使用插件更换WordPress Admin URL

一般情况下,WordPress生成一个缺省的admin URL http://www.yoursite.com/wp-login.php。由于这个链接众所周知,如果你泄露了密码或者在不止一处使用了同一个密码,未获授权的陌生人很容易就可以访问你的WordPress管理面板,这对你的站点是有害的并且使得你的站点容易被入侵。

管理面板的安全性是WordPress安全性的重要组成部分。为了确保管理面板的安全,我们可以更换缺省URL并创建一个自定义的URL来登录,登出,管理和注册我们的站点。

显然,最佳并且最容易的修改URL的方式是使用插件。在下面,我们只介绍几个最佳的URL自定义管理插件,然后我们以Lockdown WP Admin为例来展示更换WordPress 管理URL的详细步骤。

更换WordPress管理URL的最佳插件

WordPress admin plugin

在大多数情况下,使用一个合适的插件是自定义WordPress站点最简单的方式,尤其是对技术知识不多的用户来说。我们也可以使用一个简单的插件很容易地变更缺省的WordPress管理URL。这里是修改URL排名前3的插件,你可以在管理面板中进行试用。

  • Lockdown WP Admin: 这是一个有用的WordPress插件可以对入侵者隐藏管理模块和登录屏幕。如果一个没有登录你的站点的用户想要访问管理面板(/wp-admin/),此插件将URL隐藏并转向一个404页面。此外 ...

继续阅读

Infobright数据仓库技术

Dominik S´ le¸ zak Infobright Inc. 波兰 slezak@infobright.com
Victoria Eastwood Infobright Inc. 加拿大 victoriae@infobright.com

1. 引言

Infobright社区版 (ICE,开源) 与 Infobright 企业版 (IEE,商业许可) 能够对TB数量级的数据执行即席查询[13]。MySQL 可插拔式的存储引擎架构可以帮助用户轻松入门,并提供丰富的数据库功能[19]。基于数据压缩 (参见[11]),列式数据存储 (参见[16]),自适应查询处理 (参见[9]),以及粗糙集理论 ...

继续阅读

推荐系统中的主要推荐方法

在推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。

一、基于内容推荐

基于内容的推荐(Content-based Recommendation)是信息过滤技术的延续与发展,它是建立在项目的内容信息上作出推荐的,而不需要依据用户对项目的评价意见,更多地需要用机 器学习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。在基于内容的推荐系统中,项目或对象是通过相关的特征的属性来定义,系统基于用户评价对象 的特征,学习用户的兴趣,考察用户资料与待预测项目的相匹配程度。用户的资料模型取决于所用学习方法,常用的有决策树、神经网络和基于向量的表示方法等。 基于内容的用户资料是需要有用户的历史数据,用户资料模型可能随着用户的偏好改变而发生变化。

基于内容推荐方法的优点是:
1)不需要其它用户的数据,没有冷开始问题和稀疏问题。
2)能为具有特殊兴趣爱好的用户进行推荐 ...

继续阅读