刘杰乱弹

Ruby require 时的一些问题

虽然在ubuntu上的rails里面使用过很多次的RMagick,但是却一直没有在单独的ruby
script中使用过,这次需要单独使用来画一些图片,于是写了一段代码,但是却跑不起来,老是报”LoadError: no such file to load — RMagick “错误,查了些资料,搞清楚原因,记录如下:
1.注意大小写敏感度
在windows或者mac上,不敏感大小写,可以:require ‘rmagick’
但是在linux上,却不行,需要写: require ‘RMagick’
否则您可能得到如下错误:
MissingSourceFile: no such file to load — rmagick
2.单独ruby中需要引用rubygems
require ‘rubygems’
require ‘RMagick’
如果不引用 rubygems,可能会看到如下错误:
`require’: no such file to load — rmagick (LoadError)
或者
`require’: no such file to load — RMagick (LoadError)
参考文档:
* 在Ubuntu上安装RMagic:http://www.hhtong.com/blog1/articles/2006/11/11/ubuntu20061111-install-rmagic
* Ruby on Rails RMagic:http://www.mysmallventures.com/ruby-on-rails-rmagick-linux-issues/


Mac os x 10.6.2 下安装 pycurl 出错解决方案

再 mac os x 10.6.2 安装pycurl 组件是出错。
错误提示:
i686-apple-darwin10-gcc-4.2.1: /usr/lib/libcurl.a: No such file or directory
powerpc-apple-darwin10-gcc-4.2.1: /usr/lib/libcurl.a: No such file or directory
i686-apple-darwin10-gcc-4.2.1: /usr/lib/libcurl.a: No such file or directory
出错原因是 setup.py 再调用 curl-config(在 /usr/bin/下)时调用了 static libs ,而 mac os x 10.6.2 已经没有静态库了,所以出错。
解决办法:
找到 setup.py 中
os.popen(”‘%s’ –libs” % CURL_CONFIG).read())+\
[…]


程序员是如何喝酒的

大家喝的是啤酒。这时你入座了。 你给自己倒了杯可乐,这叫低配置。 你给自已倒了杯啤酒,这叫标准配置。 你给自己倒了杯茶水,这茶的颜色还跟啤酒一样,这叫木马。 你给自己倒了杯可乐,还滴了几滴醋,不仅颜色跟啤酒一样,而且不冒热气还有泡 泡,这叫超级木马。 你的同事给你倒了杯白酒,这叫推荐配置。 人到齐了,酒席开始了。 你先一个人喝了一小口,这叫单元测试。 你跟旁边的人说哥们咱们随意,这叫交叉测试。 但是他说不行,这杯要干了,这叫压力测试。 于是你说那就大家一起来吧,这叫内部测试。 这个时候boss向全场举杯了,这叫公开测试。 菜过三巡,你就不跟他们客气了。 你向对面的人敬酒,这叫p2p. 你向对面的人敬酒,他回敬你,你又再敬他……,这叫tcp. 你向一桌人挨个敬酒,这叫令牌环。 你说只要是兄弟就干了这杯,这叫广播。 可是你的上司jj听了不高兴了,只有兄弟么,罚酒三杯。这叫炸弹。 可是你的下级mm听了不高兴了,我喝一口,你喝一杯,这叫恶意攻击。 有一个人过来向这桌敬酒,你说不行你先过了我这关,这叫防火墙。 你的小弟们过来敬你酒,这叫一对多。 你是boss,所有人过来敬你酒,这叫服务器。 酒是一样的,可是喝法是不同的。 你喝了一杯,boss喝了一口,这叫c#。 你喝了一杯,mm喝了一口,这叫vb。 你喝了一杯,你大哥喝了半杯,这叫c++。 你喝了半杯,你小弟喝了一杯,这叫汇编。 你喝了一杯,你的搭档也喝了一杯,这叫c。 酒是一样的,可是喝酒的人是不同的。 你越喝脸越红,这叫频繁分配释放资源。 你越喝脸越白,这叫资源不释放。 你已经醉了,却说我还能喝,叫做资源额度不足。 你明明能喝,却说我已经醉了,叫做资源保留。 你喝一段时间就上厕所,这叫cache。 酒过三巡,你也该活动活动了。 你一桌一桌的走,这叫轮巡。 你突然看到某一桌的漂亮mm,走了过去,这叫优先级。 你去了坐下来就不打算走了,这叫死循环。 你的老大举杯邀你过去,你只好过去,这叫激活事件。 你向一桌敬酒,他们说不行不行我们都喝白的,于是你也喝白的,这叫本地化。 你向boss敬酒,可是boss被围了起来,你只能站在外圈,这叫排队。 你终于到了内圈,小心翼翼的向前一步,这叫访问临界区。 你拍着boss的肩膀说哥们咱们喝一杯,这叫越界。 你不知喝了几圈了,只会说两个字,干了,这叫udp。 可是还有人拿着酒瓶跑过来说,刚才都没跟你喝,这叫丢包。 喝酒喝到最后的结果都一样 你突然跑向厕所,这叫捕获异常。 你在厕所吐了,反而觉得状态不错,这叫清空内存。 你在台面上吐了,觉得很惭愧,这叫程序异常。 你在boss面前吐了,觉得很害怕,这叫系统崩溃。 你吐到了boss身上,只能索性晕倒了,这叫硬件休克。


好累啊

太晚了 睡了啊
Mobile Blogging from here.

[]


I Love You Beth Cooper 《校花我爱你》 中文字幕

下了个电影竟然没字幕,索性翻译了,提供给广大网友,翻译的不好还望大家多多指点。
srt格式的。
I Love You Beth Cooper 中文字幕下载
《校花我爱你》中文字幕下载
影片简介 
  影片的主人公是一位看起来有些呆头呆脑的学生代表,在毕业典礼时向全校的校花贝丝·库柏发出爱的宣言。出乎他的意料的是,贝丝在这天晚上出现在他家的门口,为的是给他一个最难忘的夜晚……
  高中毕业,代表着你即将告别少年时代,正式向成人的世界迈进,到了这种时候,你往往会在焦虑和手足无措的情况下,做出惊人的举动……丹尼斯·考沃曼(保罗·鲁斯特饰)绝对属于那种说话做事都极度招人厌烦的“怪胎”,然而就是这样一个处处透着古怪的男孩,却在毕业典礼的演讲上让所有人都跌破了眼镜。也许是意识到自己以后可能再也没有这样的机会了,所以丹尼斯将一切都抛到了九霄云外,当着全校师生的面,突然向学校里最受欢迎的啦啦队长贝丝·库珀(海顿·潘妮蒂尔饰)表达了自己长久以来的爱慕之情,每一个字都是那么地铿锵有力、掷地有声–贝丝·库珀,我爱你!
  一尝心愿的丹尼斯本来已经做好了接受大家的讥讽和嘲弄的准备,可是他却惊讶的发现,甜美得不像是真人的贝丝在毕业舞会之后,突然现身在他的房门前–身边跟着特瑞茜(劳伦·斯多姆饰)和卡米(劳伦·伦敦饰),她们是形影不离的“姐妹花”,就像丹尼斯和他的哥们里奇(杰克·卡朋特饰)一样。
  虽然最开始的时候,丹尼斯被香槟酒瓶上的木塞打中了眼睛,引起了小小的混乱,但基本上而言,5个人很快就恢复了“夜游”的亢奋。然而,在一种全然没有任何警示的情况下,贝丝那块头有如大猩猩的男友凯文(肖恩·罗伯茨饰)突然而至,他已经埋伏好准备把可怜的丹尼斯狠狠地揍一顿了,两个人在发生了小冲突之后,丹尼斯竟然靠着幸运险险地逃过了一劫……这5个临时搭凑起来的伙伴显然觉得窝在房间里不够过瘾,于是他们决定开车出游,而贝丝似乎早就做好了打算,她决定要带给丹尼斯一生中最美好的一个夜晚。


关于adobe cs4的序列号问题

最近我的 adobe cs4 报错
出现 license expired
找了一下解决办法是:
更换新的序列号
先下载09年的新版本注册机:
http://www.xun6.com/file/36ff7dc13/C4_Chaitanya.zip.html [下载后请看压缩包里的说明文件]
然后删除: /Library/Application Support/Adobe/Adobe PCD/cache/cache.db [For Mac]
再重新输入注册号即可


大淘宝VS.百度之技术屏障

注意力一直在搜索引擎上,直到最近Ming总时不时提到“大淘宝”,才开始关注这件事情。
事件1:
昨日去阿里得知大淘宝计划已经实施。
事件2:
从百度部门得知,百度搜索引擎已经开始对用户的搜索、点击行为(行动轨迹)进行记录。
事件3:
阿里妈妈正在研发网络碎片相关技术嵌入阿里妈妈体系。
百度可以在第一时间拿到网民搜索数据,这点对于阿里来讲略显困难。大淘宝提出了“淘宝的数据更有价值”,不难看出,从海量的用户搜索数据到淘宝的用户购物数据,淘宝更为精准。
数据挖掘,数据挖掘……
大淘宝战略与百度抗衡的关键技术点啊!


Web2.0:帮你辨别跟你聊天的是人还是狗

今晚心血来潮和哥几个一起吃饭,我们如是说:
8年前流行一句话:你不知道互联网另一端屏幕前坐着的是个人还是条狗。 那就是web.
今天:有了SNS你就可以辨别出互联网另一端的屏幕前坐着的是人还是狗。 这就是web2.0
好大的飞跃啊!


中文分词的重要概念:条件随机场(Conditional Random Fields, CRFs)

一般序列分类模型常常采用隐马模型(HMM), 像基于类的中文分词, 但隐马 模型中存在两个假设: 输出独立性假设和马尔可夫性假设. 其中, 输出独立性假设要求序列数据严格相互独立才能保证推导的正确性, 而事实上大多数序列数据不能 被表示成一系列独立事件. 而条件随机场则使用一种概率图模型, 具有表达长距离依赖性和交叠性特征的能力, 能够较好地解决标注(分类)偏置等问题的优点, 而且所有特征可以进行全局归一化, 能够求得全局的最优解.
条件随机场是一个无向图上概率分布的学习框架, 由Lafferty 等首先引入到自然语言处理的串标引学习任务中来. 最常用的一类CRF是线性链CRF, 适用于我们的分词学习. 记观测串为W=w1w2…wn, 标记串(状态)序列 Y=y1y2…yn, 线性链CRF对一个给定串的标注, 其概率定义为:

其中, Y是串的标注序列, W是待标记的字符, fk是特征函数, λk是对应的特征函数的权值, 而t是标记, Z(W)是归一化因子, 使得上式成为概率分布.
CRF模型的参数估计通常使用L-BFGS算法来完成. CRF的解码过程, 也就是求解未知串标注的过程, 需要搜索计算该串上的一个最大联合概率, 即:
Y* = arg max(y)P(Y|W)
在线性链CRF上, 这个计算任务可以用一般的Viterbi算法来有效地完成.
目前我发现的关于CRF的实现有:
* CRF++(http://crfpp.sourceforge.net/)
* Pocket CRF(http://sourceforge.net/project/showfiles.php?group_id=201943)


分词方法三:反向最大匹配分词(BMM)

BMM方法和FMM过程类似,不同点仅在于BMM是从文本的末尾开始处理,每次匹配不成功时去掉的是最前面的一个字。BMM方法的精度要高一些,其错误率是1/245。