用Java+MySQL+PHP輕松構建跨平臺的搜索引擎
此搜索引擎適于在一個中等規模的局域網中使用,由于找到的網頁存在數據庫中,不僅可以索靜態的HTML頁面,可以搜索php、asp等動態頁面。對于一個擁有5萬個網頁的系統(使用PII-400作為服務器),搜索響應時間在2-10秒左右,完全可以滿足要求,由于Java、MySQL、PHP都是跨平臺的軟件,所以此搜索引擎不僅可以工作在Windows服務器上,而且也可以工作在Linux等其他系統中。
一、建立搜索引擎需要的數據庫和數據表。
首先建立數據庫:
c:mysqlin> mysqladmin -uroot -pmypasswd create Spider
然后建立數據庫中的表結構
c:mysqlin> mysql -uroot -pmypasswd Spider < Spider.mysql
其中Spider.mysql為一個文本文件,其內容如下:
CREATE TABLE link ( Id int(10) unsigned NOT NULL auto_increment, Url varchar(120) NOT NULL, Class tinyint(3) unsigned NOT NULL default 0 , IsSearchLink tinyint(3) unsigned default 0, PRIMARY KEY (Url), UNIQUE Id (Id), KEY Url (Url), KEY Class (Class) ); |
# 本局域網的初始主頁地址,搜索蜘蛛從此網址開始搜索所有其他網頁
INSERT INTO link VALUES( '1', 'HTTP://102.211.69.1/', '0', '0'); |
# 數據表 webpagelocal 用來存放下載的所有的網頁
CREATE TABLE webpagelocal ( Id int(10) unsigned NOT NULL auto_increment, Url varchar(120) NOT NULL, Content text NOT NULL, PRIMARY KEY (Url), UNIQUE Id (Id), KEY Url (Url) ); |
# 數據表 webpagefindfast
# 用MakeFast.php從表webpagelocal中提取512字節的檢索信息存放其中
CREATE TABLE webpagefindfast ( Id int(10) unsigned NOT NULL, Url varchar(120) NOT NULL, Title varchar(64), Content blob, PRIMARY KEY (Url), KEY Url (Url), KEY Title (Title) ); |