1、查找表中多余的重復(fù)記錄,重復(fù)記錄是根據(jù)單個字段(peopleId)來判斷。
站在用戶的角度思考問題,與客戶深入溝通,找到來賓網(wǎng)站設(shè)計與來賓網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗,讓設(shè)計與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個性化、用戶體驗好的作品,建站類型包括:成都網(wǎng)站設(shè)計、成都網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣、申請域名、虛擬空間、企業(yè)郵箱。業(yè)務(wù)覆蓋來賓地區(qū)。
2、刪除表中多余的重復(fù)記錄,重復(fù)記錄是根據(jù)單個字段(peopleId)來判斷,只留有rowid最小的記錄。
3、查找表中多余的重復(fù)記錄(多個字段)。
4、刪除表中多余的重復(fù)記錄(多個字段),只留有rowid最小的記錄。
5、查找表中多余的重復(fù)記錄(多個字段),不包含rowid最小的記錄。就完成了。
這個函數(shù)的功能主要是用于去除給定字符串中重復(fù)的字符串.在使用中需要指定字符串的分隔符.示例:
str := RemoveSameStr('zhang,Zhang,bao,Bao,bao,zhang', ',');
輸出: zhang,Zhang,bao,Bao
--SQL
str varchar2(1000);
currentIndex number;
startIndex number;
endIndex number;
type str_type is table of varchar2(30) index by binary_integer;
arr str_type;
Result varchar2(1000);
begin
-- 空字符串
if oldStr is null then
return('');
end if;
--字符串太長
if length(oldStr) 1000 then
return(oldStr);
end if;
str := oldStr;
currentIndex := 0;
startIndex := 0;
loop
currentIndex := currentIndex + 1;
endIndex := instr(str, sign, 1, currentIndex);
if (endIndex = 0) then
exit;
end if;
arr(currentIndex) := trim(substr(str,
startIndex + 1,
endIndex - startIndex - 1));
startIndex := endIndex;
end loop;
--取最后一個字符串:
arr(currentIndex) := substr(str, startIndex + 1, length(str));
--去掉重復(fù)出現(xiàn)的字符串:
for i in 1 .. currentIndex - 1 loop
for j in i + 1 .. currentIndex loop
if arr(i) = arr(j) then
arr(j) := '';
end if;
end loop;
end loop;
str := '';
for i in 1 .. currentIndex loop
if arr(i) is not null then
str := str || sign || arr(i);
--數(shù)組置空:
arr(i) := '';
end if;
end loop;
--去掉前面的標(biāo)識符:
Result := substr(str, 2, length(str));
return(Result);
end RemoveSameStr;
轉(zhuǎn)載,僅供參考。
可按如下方法去除:
如,test表中有如下數(shù)據(jù):
現(xiàn)在要刪除那么重復(fù)的數(shù)據(jù),只保留其中一條,可用如下語句:
delete?from?test?where?rowid?not?in?(select?max(rowid)?from?test?group?by?name);
commit;
執(zhí)行后結(jié)果為:
Oracle數(shù)據(jù)庫重復(fù)的數(shù)據(jù)一般有兩種去重方法,一、完全重復(fù)數(shù)據(jù)去重;二、部分字段數(shù)據(jù)重復(fù)去重。
一、完全重復(fù)數(shù)據(jù)去重方法
對于表中完全重復(fù)數(shù)據(jù)去重,可以采用以下SQL語句。
Code
CREATETABLE"#temp"AS (SELECTDISTINCT * FROM 表名);--創(chuàng)建臨時表,并把DISTINCT 去重后的數(shù)據(jù)插入到臨時表中
truncateTABLE 表名;--清空原表數(shù)據(jù)
INSERTINTO 表名(SELECT * FROM"#temp");--將臨時表數(shù)據(jù)插入到原表中
DROPTABLE"#temp";--刪除臨時表
具體思路是,首先創(chuàng)建一個臨時表,然后將DISTINCT之后的表數(shù)據(jù)插入到這個臨時表中;然后清空原表數(shù)據(jù);再講臨時表中的數(shù)據(jù)插入到原表中;最后刪除臨時表。
二、部分?jǐn)?shù)據(jù)去重方法
首先查找重復(fù)數(shù)據(jù)
select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) 1
將上面的號改為=號就可以查詢出沒有重復(fù)的數(shù)據(jù)了。
想要刪除這些重復(fù)的數(shù)據(jù),可以使用下面語句進(jìn)行刪除:
deletefrom 表名 a where 字段1,字段2 in
(select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) 1)
oracle產(chǎn)品服務(wù)
甲骨文公司產(chǎn)品主要有以下幾類:
甲骨文股份有限公司
1.服務(wù)器及工具
數(shù)據(jù)庫服務(wù)器:2013年最新版本Oracle 12C。
應(yīng)用服務(wù)器:Oracle Application Server。
開發(fā)工具:OracleJDeveloper,Oracle Designer,Oracle Developer,等等。
2.企業(yè)應(yīng)用軟件
企業(yè)資源計劃(ERP)軟件。已有10年以上的歷史。2005年,并購了開發(fā)企業(yè)軟件的仁科軟件公司(PeopleSoft)以增強在這方面的競爭力。
客戶關(guān)系管理(CRM)軟件。自1998年開始研發(fā)這種軟件。2005年,并購了開發(fā)客戶關(guān)系管理軟件的希柏軟件公司(Siebel)。
3. Oracle職業(yè)發(fā)展力計劃(Oracle WDP)
Oracle WDP 全稱為Oracle Workforce Development Program,是Oracle (甲骨文)公司專門面向?qū)W生、個人、在職人員等群體開設(shè)的職業(yè)發(fā)展力課程。Oracle的技術(shù)廣泛應(yīng)用于各行各業(yè),其中電信、電力、金融、政府及大量制造業(yè)都需要Oracle技術(shù)人才,Oracle公司針對職業(yè)教育市場在全球推廣的項目,其以低廉的成本給這部分人群提供Oracle技術(shù)培訓(xùn),經(jīng)過系統(tǒng)化的實訓(xùn),讓這部分人群能夠迅速掌握Oracle最新的核心技術(shù),并能勝任企業(yè)大型數(shù)據(jù)庫管理、維護(hù)、開發(fā)工作。
重復(fù)的數(shù)據(jù)可能有這樣兩種情況,第一種時表中只有某些字段一樣,第二種是兩行記錄完全一樣。Oracle數(shù)據(jù)庫重復(fù)數(shù)據(jù)刪除技術(shù)有如下優(yōu)勢:更大的備份容量、數(shù)據(jù)能得到持續(xù)驗證、有更高的數(shù)據(jù)恢復(fù)服務(wù)水平、方便實現(xiàn)備份數(shù)據(jù)的容災(zāi)。
一、刪除部分字段重復(fù)數(shù)據(jù)先來談?wù)勅绾尾樵冎貜?fù)的數(shù)據(jù)吧。
下面語句可以查詢出那些數(shù)據(jù)是重復(fù)的:
select
字段1,字段2,count(*)
from
表名
group
by
字段1,字段2
having
count(*)
1
將上面的號改為=號就可以查詢出沒有重復(fù)的數(shù)據(jù)了。
想要刪除這些重復(fù)的數(shù)據(jù),可以使用下面語句進(jìn)行刪除
delete
from
表名
a
where
字段1,字段2
in
(select
字段1,字段2,count(*)
from
表名
group
by
字段1,字段2
having
count(*)
1)
上面的語句非常簡單,就是將查詢到的數(shù)據(jù)刪除掉。不過這種刪除執(zhí)行的效率非常低,對于大數(shù)據(jù)量來說,可能會將數(shù)據(jù)庫吊死。所以我建議先將查詢到的重復(fù)的數(shù)據(jù)插入到一個臨時表中,然后對進(jìn)行刪除,這樣,執(zhí)行刪除的時候就不用再進(jìn)行一次查詢了。如下:
CREATE
TABLE
臨時表
AS
(select
字段1,字段2,count(*)
from
表名
group
by
字段1,字段2
having
count(*)
1)
上面這句話就是建立了臨時表,并將查詢到的數(shù)據(jù)插入其中。
下面就可以進(jìn)行這樣的刪除操作了:
delete
from
表名
a
where
字段1,字段2
in
(select
字段1,字段2
from
臨時表);
這種先建臨時表再進(jìn)行刪除的操作要比直接用一條語句進(jìn)行刪除要高效得多。
這個時候,大家可能會跳出來說,什么?你叫我
正在看的ORACLE教程是:oracle快速刪除重復(fù)的記錄。做項目的時候,一位同事導(dǎo)數(shù)據(jù)的時候,不小心把一個表中的數(shù)據(jù)全都搞重了,也就是說,這個表里所有的記錄都有一條重復(fù)的。這個表的數(shù)據(jù)是千萬級的,而且是生產(chǎn)系統(tǒng)。也就是說,不能把所有的記錄都刪除,而且必須快速的把重復(fù)記錄刪掉。
對此,總結(jié)了一下刪除重復(fù)記錄的方法,以及每種方法的優(yōu)缺點。
為了陳訴方便,假設(shè)表名為Tbl,表中有三列col1,col2,col3,其中col1,col2是主鍵,并且,col1,col2上加了索引。
1、通過創(chuàng)建臨時表
可以把數(shù)據(jù)先導(dǎo)入到一個臨時表中,然后刪除原表的數(shù)據(jù),再把數(shù)據(jù)導(dǎo)回原表,SQL語句如下:
creat table tbl_tmp (select distinct* from tbl);truncate table tbl;//清空表記錄insert into tbl select * from tbl_tmp;//將臨時表中的數(shù)據(jù)插回來。
這種方法可以實現(xiàn)需求,但是很明顯,對于一個千萬級記錄的表,這種方法很慢,在生產(chǎn)系統(tǒng)中,這會給系統(tǒng)帶來很大的開銷,不可行。
2、利用rowid
在oracle中,每一條記錄都有一個rowid,rowid在整個數(shù)據(jù)庫中是唯一的,rowid確定了每條記錄是oracle中的哪一個數(shù)據(jù)文件、塊、行上。在重復(fù)的記錄中,可能所有列的內(nèi)容都相同,但rowid不會相同。SQL語句如下:
delete from tbl where rowid in (select a.rowid from tbl a, tbl b where a.rowidb.rowid and a.col1=b.col1 and a.col2 = b.col2)
如果已經(jīng)知道每條記錄只有一條重復(fù)的,這個sql語句適用。但是如果每條記錄的重復(fù)記錄有N條,這個N是未知的,就要考慮適用下面這種方法了。
3、利用max或min函數(shù)
這里也要使用rowid,與上面不同的是結(jié)合max或min函數(shù)來實現(xiàn)。SQL語句如下
delete from tbl awhere rowid not in (select max(b.rowid) from tbl b where a.col1=b.col1 and a.col2 = b.col2);//這里max使用min也可以
或者用下面的語句
delete from tbl awhere rowid(select max(b.rowid) from tbl b where a.col1=b.col1 and a.col2 = b.col2);//這里如果把max換成min的話,前面的where子句中需要把""改為""
跟上面的方法思路基本是一樣的,不過使用了group by,減少了顯性的比較條件,提高效率。SQL語句如下:
deletefrom tbl where rowid not in (select max(rowid) from tbl tgroup by t.col1, t.col2);delete from tbl where (col1, col2) in (select col1,col2 from tblgroup bycol1,col2havingcount(*) 1)and rowidnotin(selectnin(rowid)fromtblgroup bycol1,col2havingcount(*) 1)
還有一種方法,對于表中有重復(fù)記錄的記錄比較少的,并且有索引的情況,比較適用。假定col1,col2上有索引,并且tbl表中有重復(fù)記錄的記錄比較少,SQL語句如下4、利用group by,提高效率
網(wǎng)站欄目:oracle如何去除重復(fù),Oracle 去重復(fù)
文章出自:http://www.rwnh.cn/article20/dsdjsjo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司、關(guān)鍵詞優(yōu)化、虛擬主機、靜態(tài)網(wǎng)站、網(wǎng)頁設(shè)計公司、營銷型網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)