14年的大概9月份,正是来到这个人生地不熟的地方出差的日子里,就在那段时间原来博客所在的VPS遭遇灭顶之灾。所有数据全部丢失。其他网站都有备份恢复,偏偏博客没有备份用于恢复。只好重新开始于2014年的程序员节,也就是现在这个博客。
近期,扒拉出过去三年的四五块硬盘、移动硬盘,还有各种网盘,总想找出过去博客的备份来恢复一下,持续了近一个月时间,一直成为心病。到今天把网盘翻出最后一颗救命的备份tgz包也只是看到其他的备份mysql数据库,偏偏没有这个博客的备份。于是便考虑通过google和baidu的网站快照看能不能用于恢复。但是通过site查看,百度和google都没有2014年以前的快照。突然间灵机一动,输入网站快照,便出现了这个Wayback Machine这个网站。这个网站简直像网页时光机一样,存储了我那三年时间的所有网站快照。
[引用自维基百科] 联网档案馆(英语:Internet Archive)是一个非营利性的数字图书馆。成立于1996年,由Alexa创始人布鲁斯特·卡利创办。提供数字数据如网站、音乐、动态图像、和数百万书籍的永久性免费存储及获取。迄至2012年10月,其信息储量达到10PB[2][3]。除此之外,该档案馆也是网络开放与自由化的倡议者之一。
其数据是由自带的网络爬虫自动搜集的,其网页档案馆“时光机”(Wayback Machine),抓取了超过1500亿的网页[4][5]。
其年度预算约100万美元,来源则是其网页爬虫服务、合作关系、赞助以及卡利-奥斯丁基金会(Kahle-Austin Foundation)[6]。总部位于旧金山里奇蒙德区,此地雇员只有数十人,大部分雇员工作于书籍扫描中心,在红木城也有数据中心。
该数据库是国际互联网保存联盟成员[7],2007年被加利福尼亚州选为官方指定图书馆[8]。
目前为止,这个网站时光机已经储存了498 billion web pages saved over time。接近5000亿的网页。
这个网站还提供免费电子书、软件、电影、音乐、语音等等
下面是令我激动的页面,抓取2014-07-27 21:08:27,我依稀记得那是来这边的头一天晚上,28号早上匆匆赶飞机到了青岛,然后28号晚上住在青岛(那次应该是在机场和飞机上呆了大半天,原计划在青岛不停留),29号一早赶到烟台,人生中第一次看到了大海。
原地址:http://web.archive.org/web/20140727210827/http://www.muxiaofei.com/
这个网站时光机,还保存当时的站点地图,目前的想法是通过站点地图以及网站提供的API将博客爬回来,然后恢复到数据中。
##WayBack Machine使用方法
http://jingyan.baidu.com/article/59a015e34aab6df79588654f.html
最后,如果有想看看过去的网站(1995年到现在),强烈推荐Wayback Machine网页时光机!
能找回数据还是相当不错的。
已开始逐步恢复!程序解析html加手动结合工作。
谢谢博主的分享!!
前来催更~
这个推荐不错
这个站非常著名,不错有些数据在,有些会丢失的, 很多动态页面保存不了
我的很多文章基本都通过这个恢复回来了,非常神奇!