html文本解析类库jsoup

jsoup是一个html的开源解析器,正像我之前说的那样,这里的j指的是java。所谓解析html最常规的应用场景就是抓取某个html文本,然后获得其中的某个节点的内容(把html当做XML理解就好了)。java解析html的类库不在少数,但是在我接触的这么多开源库中个人觉得jsoup使用起来最为友好,最为简便。说其简便,那是因为它支持jQuery选择器语法。

jsoup是一个开源的java库,主页地址http://jsoup.org。这里简单的介绍下用法,现在有这样一个应用场景,在做apache监控的时候需要获得apache的server-status页面的内容,进而解析出html的内容。虽然apache的status提供了方便机器读取的auto页面,但是其毕竟很有限,如果需要获得连接的详细信息的话就只有抓取html页面进而解析出来。现在假定apache开启mod_status模块,并启用ExtendedStatus。

确认status模块可用,现在抓取连接信息,如下图的内容

十二年四月番扫番报告其二

嘛嘛,四月番的扫番报告什么的,转眼间就到六月了,七月番有些也开始了,于是今天想起来还有这个没写,于是抓紧写点什么吧。四月份那说实话确实比较出人意料,值得看一下的片子确实不少,但是到目前也弃了不少。除了几部想看的番之外,其余都觉得是闲来无事消遣时间使用。七月番的话按照现在的消息来看比较平凡,亮点较少。而之前的爆炸性新闻的新番估计要么是十月番要么就是明年,比如那《魔禁》剧场版貌似就排到明年了。好了回到正文,继续四月番的扫番报告。

###六、《AKB0048》###

AKB0048,这片的卖点是什么?两点,AKB48和闪亮的CV表。AKB48其实本人没有关注过,但是感觉到她们的影响力确实非同凡响,无论是国内还是G+上。听说这片子不差钱,但是看起来和之前骗钱大师的纯fans向作品有很大区别,骗钱大师由于本人的印象仅仅是nico的“御三家”,然后就是各种MMD什么,其余了解很少。但是看这个片子的时候我看到了闪亮的CV表和河森的大名,而且OP和ED听起来也挺不错,于是就觉得追这看下去了吧。

十三年四月番扫番报告其一

13年四月番依旧是强势作品云集的档期,即便是以往不温不火的七月番目前也有好几个非常令人期待的动画排在了放送时间表里。

四月首先是非常期待的《超电磁炮2》也就是《超电磁炮S》,进击的巨人在开播前也被炒的热火朝天,内涵十足的《恶之华》也非常令人期待。在刚刚过去的五月份,我们看到了又一部《妄想学生会》的OAV(不知道是翻译出错了还是官方从良了),然后是第十回博丽神社例大祭,伴随着福满华丽的作画,东方众迎来了一场盛宴。

###一、《某科学的超电磁炮》###

作为魔禁外传性质的超电磁炮一经推出获得了超乎寻常的好评,也许就像《无头骑士异闻录》里面狩沢绘理华说的那样bilibili将成为主角。

相比《魔禁》主角那样三天一小伤,五天一大伤,超电磁炮更像是校园百合剧,无奈有魔禁这个大背景,御坂美琴的将来也必定会很“坎坷”的。

Ubuntu11.10 NTFS权限与SVN配置

本人一项没有追版本的习惯,除非需要新版本的功能。前一段时间看到消息说android的SDK和仿真器更新了,由于inter的贡献,X86下效率提高了很多。我想这个是期待已久的,于是就去更新。然后开eclipse提示ADT要更新,好吧更新就更新吧。这时候提示eclipse版本太低,让更新eclipse。于是好吧我去下了个最新的eclipse,貌似是3.7的样子,然后我去装SVN,提示需要JAVAHL,好吧,这个之前装过,于是执行命令发现javaHL已经安装过了,但是版本不对,而新版本还没有提交大仓库了…………..

十二年四月番扫番报告其一

撒,又到了每季度一次的扫番报告的时间了。说到扫番报告至少每个新番至少要看一些,即便是最终弃掉什么的。所以在四月番基本上都看过几话之后,个人觉得这些番的情况基本定型于是才敢出来写自己的感想。

四月番从整体来说个人觉得质量非常高,很多细节都做的非常用心。从最开始的新番介绍来看,感觉总体是CV控的福利,各种华丽的CV表闪瞎人眼。值得一提的是参与番组最多的是丰崎爱生,香菜已退居第二阵营。上季度的扫番报告,在《妖狐X我 SS》中我抱怨丰崎爱生的角色过少的问题在四月番有个很大的改变,但是这需要对不同角色的不同发挥,这点个人觉得不是很满意。详细关于丰崎爱生在四月番的表现在具体的新番评价中给予说明。

###一、《这个是僵尸吗?地狱变》###

《这个是僵尸吗?地狱变》四月番已僵尸为题材的新番都比较出彩,《这个是僵尸吗?》第一季的时候效果非常好,满满的吐槽点什么的。特别是第一季字幕君在OP制作的神弹幕,另人印象非常深刻。

android与PC直连的socket问题

突然有人说使用android的模拟器做socket服务器,PC做客户端,使用UDP通信的时候,android端无法收到数据包。反过来没问题,我觉得这怎么可能,首先如果你代码没问题的话,那就只有真实IP和端口有问题了。于是我搜索了一下,网上还真不少人问这个问题,我不得不说现在java程序员都被SSH毁了,很多已经到了不去思考的地步了,遇到问题想都不想一问,原来你也这样?既然大家都这样,那就说明无法解决了……….

特别是对java来说开源库各种各样,很多人已经养成了不去思考和尝试的习惯,直接找现有的实现了。这样就完全没有编程的乐趣了,哎,好了回到本文要点吧。首先对于TCP/UDP通信来说至少要有一定的知识。

首先在不考虑TCP/UDP的具体协议和实现方式、网络设备和OSI各种协议的前提下至少要明白java的SOCKET框架,当然SOCKET对于各种语言来说道理是完全一样的,只是底层实现不同而已,到了java连socket的实现也不需要管了,只要知道类库怎么用就可以。

android ADB的unicode字符问题

andoid中存在的adb-server服务,可以在命令行使用android SDK中的ADB命令与android设备中的adb-server进行通信,当然前提是android设备要打开调试模式(Debug Mode)。大家应该知道一个问题就是,android基于Linux内核,其内部使用UTF-8编码,但是在非unicode编码的系统如windows中文版系统中大多使用的编码是GBK,即国标。于是在不经任何处理的非UTF-8编码环境下就会出现编码问题,android设备在处理的时候由于编码问题出现乱码或者根本无法执行。最直接的表现就是使用adb push中文或其他unicode编码的文件名时,出现Invalid argument错误。

以下使用windows 7 X86旗舰版和Ubuntu11.10 X86版分别介绍下产生这个问题的原因和解决方法。首先是windows,如下:

十二年十月番扫番报告其二

话说这十月番扫番报告一坑就是将近三个月,如果有朋友还有心情看这个的话,那真是感激不尽。那么接下来继续12年十月番扫番计划第二部分。

首先说一些关于《HAITAI 七叶》这个番的问题,当时这个番出现在十月的番组表上,显示的是琉球地区播放。看样子是有些地方性宣传的意味,当时这部番没有字幕组接手,据说是因为播放地区没有录制人员的原因。现在这个番突然出现在13年一月档期,在大批量泡面番中显得格外的突出。非常值得我们去期待。

###六、《少女与战车》###

毫无疑问,《少女与战车》是十月番最为出人意料作品。它的突然火爆的程度,也许连监督水岛努也没有想到吧。

少女与战车,不是军事宅还真的很难评价。当时也是随意看一下,理由就是监督比较另人在意。本以为这番就像之前的《枪械少女》和那什么一样,但是看了一话之后觉得,这画风和设定好像挺有诚意的样子。直到后面的剧情展开… …

十二年春季番扫番报告其二

嘛嘛,找点儿时间来写扫番报告了。每季度的番组何其多,自己有机会接触到的是少之又少,而且个人关注的也仅仅是为数不多的自己觉得好看的片子,于是这里不能像大型的论坛网站那样地毯式的扫一遍。还有就是这是一个人的报告,不一定客观和符合大多数人的喜好,说错的地方还请包涵。

###六、《伪物语》###

我想这个不必多说,之前的《化物语》简直就是逆天了。西尾维新的小说、新房昭之监督,神前晓的音乐。看过《化物语》小说的自然会知道,小说中大段大段的对话和内心独白描写,这样的风格自然非常适合新房昭之。新房的风格自然也不用说,他拍的动画已经很多了,经常把平淡的故事拍的有声有色,引人入胜什么的。还有标志性的新房式的回头,几乎出现在他的所有作品中。

现在回到《化物语》的时代,化物语首先红的是“战场原黑仪”,特别是自称傲娇的属性和订书机主题曲。nico进两年的动画主题曲投票,化物语曲子都是第一,我也忘记是战场原的主题曲还是,那个ED。然后是香菜唱的恋爱循环,那次的销售量在霓虹也是绝无仅有,虽然之后被小圆脸超越,但是不要忘记,小圆脸也是新房监督。如果没有新房,不知道老虚究竟会黑道什么程度。最后是班长的,也就是堀江由衣,说实话,我是堀江控,从《水果篮子》开始到现在。堀江由衣也算是实力派,基本和水树奈奈一个级别。就像我之前看《猫神八百万》一样,本人不是兽耳控,但是看了《猫神》之后就变成 兽耳 控了(哈子卡西…..)。看《猫神》的原因有两个,一个是叶庭出店的大名,另一个就是堀江由衣

十二年春季番扫番报告其一

当C81结束之后新的一年带来,新番组也开始活跃起来,就新番而言一般是十月番整体实力最强,各种大作云集。其他小制作或者制作组不出名的作品都会避其锋芒,在其他季度上映。许多看似平常毫不起眼的作品很可能就是下一匹黑马。接下介绍下本人了解到的2012年春季番(有些地方也叫做冬番)也就是一月番。

###一、《轮回的拉的朗日》

《轮回的拉的朗日》据说很早即有,我看到有些论坛的老板块里就有这个讨论。首先一月番存在普遍的黑化倾向,所以这片子看刚开始的世界观,难免后面是什么剧情。刚开始的先行版充满着各种搞笑气氛,neta有些也很俗套,但是确实非常欢乐,尤其是使用马鹿口癖的元气女主。从一开始追这个主要是看吐槽,不论是甲基部还是那个飞机形态像雪风,还是萝卜形态像Miku的机器人。非常少见的强气能登,繁忙的中村等。Production I.G也是出过不少优质动画,画质还是有充分的保障。

但是话又说回来,这片子前几话过于欢乐个人感觉和整体的故事发展和世界观比较维和,所以后面极有可能存在所谓的神展开,无论是黑化还是虐心什么的该有的终究是会有的,而且萝卜动画里面男主最后便当的也不在少数,当然看情况这个动画不会有那么激进甚至是有些烂尾的结局。