在foreach循环中,如果我们需要更改迭代的元素或是为了提高效率,运用引用是一个好办法:
$arr=array(1,2,3,4);
foreach($arras$value){
$value=$value*2;
}
//$arrisnowarray(2,4,6,8)
这里有个问题很多人会迷糊。循环结束后,$value并未销毁,$value其实是数组中最后一个元素的引用,这样在后续对$value的使用中,如果不知道这一点,会引发一些莫名奇妙的错误:)看看下面这段代码:
$array=[1,2,3];
echoimplode(,,$array),\n;
foreach($arrayas$value){}//byreference
echoimplode(,,$array),\n;
foreach($arrayas$value){}//byvalue(i.e.,copy)
echoimplode(,,$array),\n;
上面代码的运行结果如下:
1,2,3
1,2,3
1,2,2
你猜对了吗?为什么是这个结果呢?
我们来分析下。第一个循环过后,$value是数组中最后一个元素的引用。第二个循环开始:
第一步:复制$arr[0]到$value(注意此时$value是$arr[2]的引用),这时数组变成[1,2,1]
第二步:复制$arr[1]到$value,这时数组变成[1,2,2]
第三步:复制$arr[2]到$value,这时数组变成[1,2,2]
综上,最终结果就是1,2,2
避免这种错误最好的办法就是在循环后立即用unset函数销毁变量:
$arr=array(1,2,3,4);
foreach($arras$value){
$value=$value*2;
}
unset($value);//$valuenolongerreferences$arr[3]
错误2:对isset()函数行为的错误理解对于isset()函数,变量不存在时会返回false,变量值为null时也会返回false。这种行为很容易把人弄迷糊。。。看下面的代码:
$data=fetchRecordFromStorage($storage,$identifier);
if(!isset($data[keyShouldBeSet]){
//dosomethinghereifkeyShouldBeSetisnotset
}
写这段代码的人本意可能是如果$data[‘keyShouldBeSet’]未设置,则执行对应逻辑。但问题在于即使$data[‘keyShouldBeSet’]已设置,但设置的值为null,还是会执行对应的逻辑,这就不符合代码的本意了。
下面是另外一个例子:
if($_POST[active]){
$postData=extractSomething($_POST);
}
//...
if(!isset($postData)){
echopostnotactive;
}
上面的代码假设$_POST[‘active’]为真,那么$postData应该被设置,因此isset($postData)会返回true。反之,上面代码假设isset($postData)返回false的唯一途径就是$_POST[‘active’]也返回false。
真是这样吗?当然不是!
即使$_POST[‘active’]返回true,$postData也有可能被设置为null,这时isset($postData)就会返回false。这就不符合代码的本意了。
如果上面代码的本意仅是检测$_POST[‘active’]是否为真,下面这样实现会更好:
if($_POST[active]){
$postData=extractSomething($_POST);
}
//...
if($_POST[active]){
echopostnotactive;
}
判断一个变量是否真正被设置(区分未设置和设置值为null),array_key_exists()函数或许更好。重构上面的第一个例子,如下:
$data=fetchRecordFromStorage($storage,$identifier);
if(!array_key_exists(keyShouldBeSet,$data)){
//dothisifkeyShouldBeSetisntset
}
另外,结合get_defined_vars()函数,我们可以更加可靠的检测变量在当前作用域内是否被设置:
if(array_key_exists(varShouldBeSet,get_defined_vars())){
//variable$varShouldBeSetexistsincurrentscope
}
错误3:混淆返回值和返回引用考虑下面的代码:
classConfig
{
private$values=[];
publicfunctiongetValues(){
return$this-values;
}
}
$config=newConfig();
$config-getValues()[test]=test;
echo$config-getValues()[test];
运行上面的代码,将会输出下面的内容:
PHPNotice:Undefinedindex:testin/path/to/my/script.phponline21
问题出在哪呢?问题就在于上面的代码混淆了返回值和返回引用。在PHP中,除非你显示的指定返回引用,否则对于数组PHP是值返回,也就是数组的拷贝。因此上面代码对返回数组赋值,实际是对拷贝数组进行赋值,非原数组赋值。
//getValues()returnsaCOPYofthe$valuesarray,sothisaddsatestelement
//toaCOPYofthe$valuesarray,butnottothe$valuesarrayitself.
$config-getValues()[test]=test;
//getValues()againreturnsANOTHERCOPYofthe$valuesarray,andTHIScopydoesnt
//containatestelement(whichiswhywegettheundefinedindexmessage).
echo$config-getValues()[test];
下面是一种可能的解决办法,输出拷贝的数组,而不是原数组:
$vals=$config-getValues();
$vals[test]=test;
echo$vals[test];
如果你就是想要改变原数组,也就是要反回数组引用,那应该如何处理呢?办法就是显示指定返回引用即可:
classConfig
{
private$values=[];
//returnaREFERENCEtotheactual$valuesarray
publicfunctiongetValues(){
return$this-values;
}
}
$config=newConfig();
$config-getValues()[test]=test;
echo$config-getValues()[test];
经过改造后,上面代码将会像你期望那样会输出test。
我们再来看一个例子会让你更迷糊的例子:
classConfig
{
private$values;
//usingArrayObjectratherthanarray
publicfunction__construct(){
$this-values=newArrayObject();
}
publicfunctiongetValues(){
return$this-values;
}
}
$config=newConfig();
$config-getValues()[test]=test;
echo$config-getValues()[test];
如果你想的是会和上面一样输出“Undefinedindex”错误,那你就错了。代码会正常输出“test”。原因在于PHP对于对象默认就是按引用返回的,而不是按值返回。
综上所述,我们在使用函数返回值时,要弄清楚是值返回还是引用返回。PHP中对于对象,默认是引用返回,数组和内置基本类型默认均按值返回。这个要与其它语言区别开来(很多语言对于数组是引用传递)。
像其它语言,比如java或C#,利用getter或setter来访问或设置类属性是一种更好的方案,当然PHP默认不支持,需要自己实现:
classConfig
{
private$values=[];
publicfunctionsetValue($key,$value){
$this-values[$key]=$value;
}
publicfunctiongetValue($key){
return$this-values[$key];
}
}
$config=newConfig();
$config-setValue(testKey,testValue);
echo$config-getValue(testKey);//echostestValue
上面的代码给调用者可以访问或设置数组中的任意值而不用给与数组public访问权限。感觉怎么样:)
错误4:在循环中执行sql查询在PHP编程中发现类似下面的代码并不少见:
$models=[];
foreach($inputValuesas$inputValue){
$models[]=$valueRepository-findByValue($inputValue);
}
当然上面的代码是没有什么错误的。问题在于我们在迭代过程中$valueRepository-findByValue()可能每次都执行了sql查询:
$result=$connection-query(SELECT`x`,`y`FROM`values`WHERE`value`=.$inputValue);
如果迭代了次,那么你就分别执行了次sql查询。如果这样的脚本在多线程程序中被调用,那很可能你的系统就挂了。。。
在编写代码过程中,你应该要清楚什么时候应该执行sql查询,尽可能一次sql查询取出所有数据。
有一种业务场景,你很可能会犯上述错误。假设一个表单提交了一系列值(假设为IDs),然后为了取出所有ID对应的数据,代码将遍历IDs,分别对每个ID执行sql查询,代码如下所示:
$data=[];
foreach($idsas$id){
$result=$connection-query(SELECT`x`,`y`FROM`values`WHERE`id`=.$id);
$data[]=$result-fetch_row();
}
但同样的目的可以在一个sql中更加高效的完成,代码如下:
$data=[];
if(count($ids)){
$result=$connection-query(SELECT`x`,`y`FROM`values`WHERE`id`IN(.implode(,,$ids));
while($row=$result-fetch_row()){
$data[]=$row;
}
}
错误5:内存使用低效和错觉一次sql查询获取多条记录比每次查询获取一条记录效率肯定要高,但如果你使用的是php中的mysql扩展,那么一次获取多条记录就很可能会导致内存溢出。
我们可以写代码来实验下(测试环境:MBRAM、MySQL、php-cli):
//connecttomysql
$connection=newmysqli(localhost,username,password,database);
//createtableofcolumns
$query=CREATETABLE`test`(`id`INTNOTNULLPRIMARYKEYAUTO_INCREMENT;
for($col=0;$col;$col++){
$query.=,`col$col`CHAR(10)NOTNULL;
}
$query.=);;
$connection-query($query);
//write2millionrows
for($row=0;$row;$row++){
$query=INSERTINTO`test`VALUES($row;
for($col=0;$col;$col++){
$query.=,.mt_rand(00,);
}
$query.=);
$connection-query($query);
}
现在来看看资源消耗:
//connecttomysql
$connection=newmysqli(localhost,username,password,database);
echoBefore:.memory_get_peak_usage().\n;
$res=$connection-query(SELECT`x`,`y`FROM`test`LIMIT1);
echoLimit1:.memory_get_peak_usage().\n;
$res=$connection-query(SELECT`x`,`y`FROM`test`LIMIT);
echoLimit:.memory_get_peak_usage().\n;
输出结果如下:
Before:
Limit1:
Limit:
根据内存使用量来看,貌似一切正常。为了更加确定,试着一次获取0条记录,结果程序得到如下输出:
PHPWarning:mysqli::query():(HY/):
LostconnectiontoMySQLserverduringqueryin/root/test.phponline11
这是怎么回事呢?
问题出在php的mysql模块的工作方式,mysql模块实际上就是libmysqlclient的一个代理。在查询获取多条记录的同时,这些记录会直接保存在内存中。由于这块内存不属于php的内存模块所管理,所以我们调用memory_get_peak_usage()函数所获得的值并非真实使用内存值,于是便出现了上面的问题。
我们可以使用mysqlnd来代替mysql,mysqlnd编译为php自身扩展,其内存使用由php内存管理模块所控制。如果我们用mysqlnd来实现上面的代码,则会更加真实的反应内存使用情况:
Before:
Limit1:
Limit:
更加糟糕的是,根据php的官方文档,mysql扩展存储查询数据使用的内存是mysqlnd的两倍,因此原来的代码使用的内存是上面显示的两倍左右。
为了避免此类问题,可以考虑分几次完成查询,减小单次查询数据量:
$totalNumberToFetch=;
$portionSize=;
for($i=0;$i=ceil($totalNumberToFetch/$portionSize);$i++){
$limitFrom=$portionSize*$i;
$res=$connection-query(
SELECT`x`,`y`FROM`test`LIMIT$limitFrom,$portionSize);
}
联系上面提到的错误4可以看出,在实际的编码过程中,要做到一种平衡,才能既满足功能要求,又能保证性能。
错误6:忽略Unicode/UTF-8问题php编程中,在处理非ascii字符时,会遇到一些问题,要很小心的去对待,要不然就会错误遍地。举个简单的例子,strlen($name),如果$name包含非ascii字符,那结果就有些出乎意料。在此给出一些建议,尽量避免此类问题:
如果你对unicode和utf-8不是很了解,那么你至少应该了解一些基础。推荐阅读这篇文章。
最好使用mb_*函数来处理字符串,避免使用老的字符串处理函数。这里要确保PHP的“multibyte”扩展已开启。
数据库和表最好使用unicode编码。
知道jason_code()函数会转换非ascii字符,但serialize()函数不会。
php代码源文件最好使用不含bom的utf-8格式。
在此推荐一篇文章,更详细的介绍了此类问题:UTF-8PrimerforPHPandMySQL
错误7:假定$_POST总是包含POST数据PHP中的$_POST并非总是包含表单POST提交过来的数据。假设我们通过jQuery.ajax()方法向服务器发送了POST请求:
//js
$.ajax({
url: