top
Loading...
用Java+MySQL+PHP輕松構建跨平臺的搜索引擎

此搜索引擎適于在一個中等規模的局域網中使用,由于找到的網頁存在數據庫中,不僅可以索靜態的HTML頁面,可以搜索php、asp等動態頁面。對于一個擁有5萬個網頁的系統(使用PII-400作為服務器),搜索響應時間在2-10秒左右,完全可以滿足要求,由于Java、MySQL、PHP都是跨平臺的軟件,所以此搜索引擎不僅可以工作在Windows服務器上,而且也可以工作在Linux等其他系統中。

一、建立搜索引擎需要的數據庫和數據表。

首先建立數據庫:

c:mysqlin> mysqladmin -uroot -pmypasswd create Spider

然后建立數據庫中的表結構

c:mysqlin> mysql -uroot -pmypasswd Spider < Spider.mysql

其中Spider.mysql為一個文本文件,其內容如下:

CREATE TABLE link (
Id int(10) unsigned NOT NULL auto_increment,
Url varchar(120) NOT NULL,
Class tinyint(3) unsigned NOT NULL default 0 ,
IsSearchLink tinyint(3) unsigned default 0,
PRIMARY KEY (Url),
UNIQUE Id (Id),
KEY Url (Url),
KEY Class (Class)
);

# 本局域網的初始主頁地址,搜索蜘蛛從此網址開始搜索所有其他網頁

INSERT INTO link VALUES( '1', 'HTTP://102.211.69.1/', '0', '0');

# 數據表 webpagelocal 用來存放下載的所有的網頁

CREATE TABLE webpagelocal (
Id int(10) unsigned NOT NULL auto_increment,
Url varchar(120) NOT NULL,
Content text NOT NULL,
PRIMARY KEY (Url),
UNIQUE Id (Id),
KEY Url (Url)
);

# 數據表 webpagefindfast

# 用MakeFast.php從表webpagelocal中提取512字節的檢索信息存放其中

CREATE TABLE webpagefindfast (
Id int(10) unsigned NOT NULL,
Url varchar(120) NOT NULL,
Title varchar(64),
Content blob,
PRIMARY KEY (Url),
KEY Url (Url),
KEY Title (Title)
);

作者:http://www.zhujiangroad.com
來源:http://www.zhujiangroad.com
北斗有巢氏 有巢氏北斗