life

读书总结:Open Life

helight | 3600字 | 阅读大约需要8分钟 | 归档于life

2020年3月14日

这本书从作者身边的生活琐事开始来思考开源这件事,到开源软件发展对社会影响思考,再到开源软件的商业之路,最后到生活中其它方面开源的思考。逐一到来非常有序,让我们对开源的认识从原来只是软件的层面会逐步上升到对生活方式的思考。

继续阅读

用户画像数据建模方法(zz)

helight | 3900字 | 阅读大约需要8分钟 | 归档于life

2015年1月14日

原文:http://blog.baifendian.com/?p=8015

从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚 焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技术。伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。相比传 统的线下会员管理、问卷调查、购物篮分析,大数据第一次使得企业能够通过互联网便利地获取用户更为广泛的反馈信息,为进一步精准、快速地分析用户行为习 惯、消费习惯等重要商业信息,提供了足够的数据基础。伴随着对人的了解逐步深入,一个概念悄然而生:用户画像(UserProfile),完美地抽象出一 个用户的信息全貌,可以看作企业应用大数据的根基。

继续阅读

zz分布式文件系统FastDFS架构剖析

helight | 5000字 | 阅读大约需要10分钟 | 归档于life

2014年5月4日

【本文系外部转贴,原文地址:http://www.programmer.com.cn/4380/】

FastDFS是一款类Google FS的开源分布式文件系统,它用纯C语言实现,支持Linux、FreeBSD、AIX等UNIX系统。 它只 能通过专有API对文件进行存取访问,不支持POSIX接口方式,不能mount使用。准确地讲,Google FS以及FastDFS、 mogileFS、HDFS、TFS等类Google FS都不是系统级的分布式文件系统,而是应用级的分布式文件存储服务。

继续阅读

扩展sawzall代码实现自定义接口

helight | 1500字 | 阅读大约需要3分钟 | 归档于life

2014年5月4日

使用sawzall开发mr程序虽然很快,不过也有不少限制,尤其对于新手来说,比如不能直接像c++一样调用线程的库,不过它提供了一种扩展开发的方式,我们可以自己修改sawzall代码实现新的功能接口,在下载平台的sawzall代码中,我们就扩展了一种聚合器,两个和我们web相关的功能接口:连接我们的domain service进行聚合域名的识别,根据url进行域名提取。这里以使用我们comm库中的url类进行域名提取为例来说明一下sawzall的功能函数扩展。

继续阅读

海量数据分析:Sawzall并行处理(中文版论文)

helight | 41100字 | 阅读大约需要82分钟 | 归档于life

2014年5月4日

海量数据分析:Sawzall并行处理(中文版论文) Google的工程师为了方便内部人员使用MapReduce,研发了一种名为 Sawzall的DSL,同时Hadoop也推出了类似Sawzall的Pig语言,但在语法上面有一定的区别。今天就给大家贴一下Sawall的论文, 值得注意的是其第一作者是UNIX大师之一(Rob Pike)。原文地址,并在这里谢谢译者崮山路上走9遍。

继续阅读

嵌入式开发中NFS调试环境搭建-V0.2

helight | 1900字 | 阅读大约需要4分钟 | 归档于life

2014年4月6日

作者:许振文

开发环境:S3C4510B+uCLinux-2.4.x+ubuntu7.10

建立的目的:可以直接在开发板上挂载开发主机上的文件系统,减少程序的烧写次数,提高程序开发速度。

NFS(Network File System, 网络文件系统)可以通过NFS把远程主机的目录挂载到本机,使得访问远程主机的目录就像访问本地目
录一样方便快捷。
NFS一般是实现linux系统之间实现共享.当然和unix之间也应该可以使用它来实现共享。但如果需要在linux和windows系统之间共
, 就得使用samba了!
NFS是一个RPC服务程序,所以在使用它之前, 先要映射好端口——通过portmap设定. 比如: 某个NFS client发起NFS服务请求时, 
它需要先得到一个端口(port).所以它先通过portmap得到port number.所以在启动NFS之前, 需要启动portmap服务

继续阅读

License

helight | 500字 | 阅读大约需要1分钟 | 归档于life

2014年4月5日

除非特别注明,本站所有原创文章皆采用 知识共享署名-非商业性使用-相同方式共享 2.5 中国大陆许可协议的创作共用协议。

您可以自由:

继续阅读

Open Source---我自己设立的一些小项目。。。

helight | 900字 | 阅读大约需要2分钟 | 归档于life

2014年4月5日

openflow

项目简介:

可视化分布式流程控制系统,数据流和业务流控制系统。

继续阅读

AboutMe

helight | 1800字 | 阅读大约需要4分钟 | 归档于life

2014年4月5日

许振文,男,计算机软件与理论的硕士生,现就读于西安邮电学院计算机系.2007年毕业于西安邮电学院,并继续攻读硕士学位。主要的研究方向是嵌入式Linux及相关方面。 目前在深圳腾讯-互动娱乐数据中心从事游戏数据分析后台开发工作。。 个人喜欢: 旅游,photo,ping pong。除此之外比较爱好历史和哲学。喜欢红色,黑色和白色。

继续阅读

storm安装过程

helight | 1400字 | 阅读大约需要3分钟 | 归档于life

2014年3月30日

storm的官方安装说明:https://github.com/nathanmarz/storm/wiki/Setting-up-a-Storm-cluster 本文主要介绍storm的单机版的安装测试,也是学习阶段,还没有机会搭建集群。

继续阅读