W3C那幫人的腦袋被驢踢了,直到javascript1.8.1才支持trim函數(與trimLeft,trimRight),可惜現在只有firefox3.5支持。由於去除字符串兩邊的空白實在太常用,各大類庫都有它的影子。加之,外國人都很有研究精神,搞鼓了相當多實現。
實現1
String.prototype.trim = function() { return this.replace(/^\s\s*/, '').replace(/\s\s*$/, ''); }
看起來不怎麼樣,動用了兩次正則替換,實際速度非常驚人,主要得益於瀏覽器的內部優化。一個著名的例子字符串拼接,直接相加比用Array做成的StringBuffer還快。 base2類庫使用這種實現。
實現2
String.prototype.trim = function() { return this.replace(/^\s+/, '').replace(/\s+$/, ''); }
和實現1很相似,但稍慢一點,主要原因是它最先是假設至少存在一個空白符。 Prototype.js使用這種實現,不過其名字為strip,因為Prototype的方法都是力求與Ruby同名。
實現3
String.prototype.trim = function() { return this.substring(Math.max(this.search(/\S/), 0),this.search(/\S\s*$/) + 1); }
以截取方式取得空白部分(當然允許中間存在空白符),總共調用了四個原生方法。設計得非常巧妙,substring以兩個數字作為參數。 Math.max以兩個數字作參數,search則返回一個數字。速度比上面兩個慢一點,但比下面大多數都快。
實現4
String.prototype.trim = function() { return this.replace(/^\s+|\s+$/g, ''); }
這個可以稱得上實現2的簡化版,就是利用候選操作符連接兩個正則。但這樣做就失去了瀏覽器優化的機會,比不上實現3。由於看來很優雅,許多類庫都使用它,如JQuery與mootools
實現5
String.prototype.trim = function() { var str = this; str = str.match(/\S+(?:\s+\S+)*/); return str ? str[0] : ''; }
match是返回一個數組,因此原字符串符合要求的部分就成為它的元素。為了防止字符串中間的空白符被排除,我們需要動用到非捕獲性分組(?:exp)。由於數組可能為空,我們在後面還要做進一步的判定。好像瀏覽器在處理分組上比較無力,一個字慢。所以不要迷信正則,雖然它基本上是萬能的。
實現6
String.prototype.trim = function() { return this.replace(/^\s*(\S*(\s+\S+)*)\s*$/, '$1'); }
把符合要求的部分提供出來,放到一個空字符串中。不過效率很差,尤其是在IE6中。
實現7
String.prototype.trim = function() { return this.replace(/^\s*(\S*(?:\s+\S+)*)\s*$/, '$1'); }
和實現6很相似,但用了非捕獲分組進行了優點,性能效之有一點點提升。
實現8
String.prototype.trim = function() { return this.replace(/^\s*((?:[\S\s]*\S)?)\s*$/, '$1'); }
沿著上面兩個的思路進行改進,動用了非捕獲分組與字符集合,用?頂替了*,效果非常驚人。尤其在IE6中,可以用瘋狂來形容這次性能的提升,直接秒殺火狐。
實現9
String.prototype.trim = function() { return this.replace(/^\s*([\S\s]*?)\s*$/, '$1'); }
這次是用懶惰匹配頂替非捕獲分組,在火狐中得到改善,IE沒有上次那麼瘋狂。
實現10
String.prototype.trim = function() { var str = this, whitespace = ' \n\r\t\f\x0b\xa0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000'; for (var i = 0,len = str.length; i < len; i++) { if (whitespace.indexOf(str.charAt(i)) === -1) { str = str.substring(i); break; } } for (i = str.length - 1; i >= 0; i--) { if (whitespace.indexOf(str.charAt(i)) === -1) { str = str.substring(0, i + 1); break; } } return whitespace.indexOf(str.charAt(0)) === -1 ? str : ''; }
我只想說,搞出這個的人已經不是用牛來形容,已是神一樣的級別。它先是把可能的空白符全部列出來,在第一次遍歷中砍掉前面的空白,第二次砍掉後面的空白。全過程只用了indexOf與substring這個專門為處理字符串而生的原生方法,沒有使用到正則。速度快得驚人,估計直逼上內部的二進制實現,並且在IE與火狐(其他瀏覽器當然也毫無疑問)都有良好的表現。速度都是零毫秒級別的。
實現11
String.prototype.trim = function() { var str = this, str = str.replace(/^\s+/, ''); for (var i = str.length - 1; i >= 0; i--) { if (/\S/.test(str.charAt(i))) { str = str.substring(0, i + 1); break; } } return str; }
實現10已經告訴我們普通的原生字符串截取方法是遠勝於正則替換,雖然是複雜一點。但只要正則不過於復雜,我們就可以利用瀏覽器對正則的優化,改善程序執行效率,如實現8在IE的表現。我想通常不會有人在項目中應用實現10,因為那個whitespace實現太長太難記了(當然如果你在打造一個類庫,它絕對是首先)。實現11可謂其改進版,前面部分的空白由正則替換負責砍掉,後面用原生方法處理,效果不遜於原版,但速度都是非常逆天。
實現12
String.prototype.trim = function() { var str = this, str = str.replace(/^\s\s*/, ''), ws = /\s/, i = str.length; while (ws.test(str.charAt(--i))); return str.slice(0, i + 1); }
實現10與實現11在寫法上更好的改進版,注意說的不是性能速度,而是易記與使用上。和它的兩個前輩都是零毫秒級別的,以後就用這個來工作與嚇人。
下面是老外給出的比較結果,執行背景是對Magna Carta 這文章(超過27,600字符)進行trim操作。
實現 | Firefox 2 | IE 6 |
---|---|---|
trim1 | 15ms | < 0.5ms |
trim2 | 31ms | < 0.5ms |
trim3 | 46ms | 31ms |
trim4 | 47ms | 46ms |
trim5 | 156ms | 1656ms |
trim6 | 172ms | 2406ms |
trim7 | 172ms | 1640ms |
trim8 | 281ms | < 0.5ms |
trim9 | 125ms | 78ms |
trim10 | < 0.5ms | < 0.5ms |
trim11 | < 0.5ms | < 0.5ms |
trim12 | < 0.5ms | < 0.5ms |
原文鏈接:http://blog.stevenlevithan.com/archives/faster-trim-javascript