life

用户画像数据建模方法(zz)

helight | 3800字 | 阅读大约需要8分钟 | 归档于life

2015年1月14日

原文:http://blog.baifendian.com/?p=8015

从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚 焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技术。伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。相比传 统的线下会员管理、问卷调查、购物篮分析,大数据第一次使得企业能够通过互联网便利地获取用户更为广泛的反馈信息,为进一步精准、快速地分析用户行为习 惯、消费习惯等重要商业信息,提供了足够的数据基础。伴随着对人的了解逐步深入,一个概念悄然而生:用户画像(UserProfile),完美地抽象出一 个用户的信息全貌,可以看作企业应用大数据的根基。

继续阅读

zz分布式文件系统FastDFS架构剖析

helight | 5000字 | 阅读大约需要10分钟 | 归档于life

2014年5月4日

【本文系外部转贴,原文地址:http://www.programmer.com.cn/4380/】

FastDFS是一款类Google FS的开源分布式文件系统,它用纯C语言实现,支持Linux、FreeBSD、AIX等UNIX系统。 它只 能通过专有API对文件进行存取访问,不支持POSIX接口方式,不能mount使用。准确地讲,Google FS以及FastDFS、 mogileFS、HDFS、TFS等类Google FS都不是系统级的分布式文件系统,而是应用级的分布式文件存储服务。

继续阅读

扩展sawzall代码实现自定义接口

helight | 1500字 | 阅读大约需要3分钟 | 归档于life

2014年5月4日

使用sawzall开发mr程序虽然很快,不过也有不少限制,尤其对于新手来说,比如不能直接像c++一样调用线程的库,不过它提供了一种扩展开发的方式,我们可以自己修改sawzall代码实现新的功能接口,在下载平台的sawzall代码中,我们就扩展了一种聚合器,两个和我们web相关的功能接口:连接我们的domain service进行聚合域名的识别,根据url进行域名提取。这里以使用我们comm库中的url类进行域名提取为例来说明一下sawzall的功能函数扩展。

继续阅读

海量数据分析:Sawzall并行处理(中文版论文)

helight | 40200字 | 阅读大约需要81分钟 | 归档于life

2014年5月4日

海量数据分析:Sawzall并行处理(中文版论文) Google的工程师为了方便内部人员使用MapReduce,研发了一种名为 Sawzall的DSL,同时Hadoop也推出了类似Sawzall的Pig语言,但在语法上面有一定的区别。今天就给大家贴一下Sawall的论文, 值得注意的是其第一作者是UNIX大师之一(Rob Pike)。原文地址,并在这里谢谢译者崮山路上走9遍。

继续阅读

嵌入式开发中NFS调试环境搭建-V0.2

helight | 1900字 | 阅读大约需要4分钟 | 归档于life

2014年4月6日

作者:许振文

开发环境:S3C4510B+uCLinux-2.4.x+ubuntu7.10



NFS(Network File System, )NFS把远程主机的目录挂载到本机,使访访
便
NFS一般是实现linux系统之间实现共享.unix之间也应该可以使用它来实现共享linux和windows系统之间共
, 使samba了!
NFS是一个RPC服务程序,使, portmap设定. : NFS client发起NFS服务请求时, 
(port).portmap得到port number.NFS之前, portmap服务

继续阅读

License

helight | 500字 | 阅读大约需要1分钟 | 归档于life

2014年4月5日

除非特别注明,本站所有原创文章皆采用 知识共享署名-非商业性使用-相同方式共享 2.5 中国大陆许可协议的创作共用协议。

您可以自由:

继续阅读

Open Source---我自己设立的一些小项目。。。

helight | 900字 | 阅读大约需要2分钟 | 归档于life

2014年4月5日

openflow

项目简介:

可视化分布式流程控制系统,数据流和业务流控制系统。

继续阅读

AboutMe

helight | 1700字 | 阅读大约需要4分钟 | 归档于life

2014年4月5日

许振文,男,计算机软件与理论的硕士生,现就读于西安邮电学院计算机系.2007年毕业于西安邮电学院,并继续攻读硕士学位。主要的研究方向是嵌入式Linux及相关方面。 目前在深圳腾讯-互动娱乐数据中心从事游戏数据分析后台开发工作。。 个人喜欢: 旅游,photo,ping pong。除此之外比较爱好历史和哲学。喜欢红色,黑色和白色。

继续阅读

storm安装过程

helight | 1400字 | 阅读大约需要3分钟 | 归档于life

2014年3月30日

storm的官方安装说明:https://github.com/nathanmarz/storm/wiki/Setting-up-a-Storm-cluster 本文主要介绍storm的单机版的安装测试,也是学习阶段,还没有机会搭建集群。

继续阅读

svn中分支开发实践学习

helight | 1300字 | 阅读大约需要3分钟 | 归档于life

2012年3月26日

从去年年中开始,在公司就一直是团队开发作战,代码也是使用svn管理,虽然事用svn管理,但是一直只是把svn作为简单的代码仓库来使用,并没有使用svn的其它功能,所有的人都在master上作修改提交,所以代码的管理十分混乱,上线不好做版本发布包,因为我可能提交了多次,中间其同学也提交了n次,导致最后版本发布包制作极为麻烦。

继续阅读

一个json数据格式导致的杯具

helight | 400字 | 阅读大约需要1分钟 | 归档于life

2011年7月12日

今天业务组的同事反馈系统数据入库失败,而且耗时耗力。。。老大说谁上,我主动请缨了。

查查查。。。从操作追到代码(这些代码不是我写的哇),最后日志发现了,是数据请求回来的地方出了问题,呃,会不是是请求的服务挂了呢,再日志了请求结果,发现,没有问题,最后发现问题处在了json_decode()这里,数据经过这家伙处理之后,竟然没有了,难道数据黑洞?

继续阅读

Helight.Xu's GNU/Linux

helight | 400字 | 阅读大约需要1分钟 | 归档于life

2010年1月18日

Zhwen Xu(Zhenwen Xu, 许振文 in Chinese), post-graduate student majored in the CS Department of Xi’an University of Post and Telecommunications.

继续阅读

☯道&禅

helight | 200字 | 阅读大约需要1分钟 | 归档于life

2010年1月18日

道生一,一生二,二生三,三生万物。。。

继续阅读

我的毕设定题

helight | 500字 | 阅读大约需要1分钟 | 归档于life

2009年3月13日

不知不觉之间研究生生活已经过去了一大半了,也到该准备研究生毕业设计的时候了。年前回家之前给陈老师说我想做嵌入式设备的远程监控,陈老师也没有说什么,其实我是知道了,老师一直想我在内核上有所发展。

继续阅读

写在回家之前的话

helight | 700字 | 阅读大约需要2分钟 | 归档于life

2009年1月15日

又是一年春节了,话题还是一样。对于这样在外飘荡的人来说,没有什么能比回家更让人坐立不安了。常常也是这样的,其实回家也就是那么几天,见见父母,见见亲戚朋友。聊聊家常,扯扯蛋。呵呵,生活好像就是这样。

继续阅读