PHP 4 на практике


Обработка строковых данных без применения регулярных выражений


При обработке больших объемов информации функции регулярных выражений сильно замедляют выполнение программы. Эти функции следует применять лишь при обработке относительно сложных строк, в которых регулярные выражения действительно необходимы. Если же анализ текста выполняется по относительно простым правилам, можно воспользоваться стандартными функциями РНР, которые заметно ускоряют обработку. Все эти функции описаны ниже.

strtok( )

Функция strtok( ) разбивает строку на лексемы по разделителям, заданным вторым параметром. Синтаксис функции strtok( ):

string strtok (string строка, string разделители)

У функции strtok( ) есть одна странность: чтобы полностью разделить строку, функцию необходимо последовательно вызвать несколько раз. При очередном вызове функция выделяет из строки следующую лексему. При этом параметр строка задается всего один раз — функция отслеживает текущую позицию в строке до тех пор, пока строка не будет полностью разобрана на лексемы или не будет задан новый параметр строка. Следующий пример демонстрирует разбиение строки по нескольким разделителям:

$info = "WJ Gi1more:wjgilmore@hotmail.com | Columbus, Ohio";

// Ограничители - двоеточие (:), вертикальная черта (|) и запятая (.) $tokens = ":|,";

$tokenized = strtok($info, $tokens);

// Вывести элементы массива $tokenized

while ($tokenized) :

echo "Element = $tokenized<br>";

// Обратите внимание: при последующих вызовах strtok

// первый аргумент не передается



$tokenized = strtok($tokens);

endwhile;

Результат:

Element = WJGilmore

Element = wjgilmore@hotmail.com

Element = Columbus

Element = Ohio

parse_str( )

Функция parse_str( ) выделяет в строке пары «переменная-значение» и присваивает значения переменных в текущей области видимости. Синтаксис функции parse_str( ):

void parse_str (string строка)

Функция parse_str( ) особенно удобна при обработке URL, содержащих данные форм HTML или другую расширенную информацию. В следующем примере анализируется информация, переданная через URL. Строка представляет собой стандартный способ передачи данных между страницами либо откомпилированных в гиперссылке, либо введенных в форму HTML:


$url = "fname=wj&lname=gilmore&zip=43210";

parse_str($url);

// После выполнения parse_str( ) доступны следующие переменные:

// $fname = "wj":

// $lname = "gilmore";

// $zip = "43210"

Поскольку эта функция создавалась для работы с URL, она игнорирует символ амперсанд (&).

Работа с формами HTML в РНР описана в главе 10.

explode ( )

Функция explode( ) делит строку на элементы и возвращает эти элементы в виде массива. Синтаксис функции explode( ):

array explode (string разделитель, string строка [, int порог])

Разбиение происходит по каждому экземпляру разделителя, причем количество полученных фрагментов может ограничиваться необязательным параметром порог. Разделение строки функцией explode( ) продемонстрировано в следующем примере:

$info = "wilson | baseball | indians";

$user = explode("|", $info);

// $user[0] = "wilson";

// $user[1] = "baseball";

// $user[2] = "Indians";

Функция explode( ) практически идентична функции регулярных выражений POSIX split( ), описанной выше. Главное различие заключается в том, что передача регулярных выражений в параметрах допускается только при вызове split( ).

implode ( )

Если функция explode( ) разделяет строку на элементы массива, то ее двойник — функция implode( ) - объединяет массив в строку. Синтаксис функции implode( ):

string implode (string разделитель, array фрагменты)

Формирование строки из массива продемонстрировано в следующем примере:

$ohio_cities = array ("Columbus", "Youngstown", "Cleveland", "Cincinnati");

$city_string = implode("l", $ohio_cities);

// $city_string = "Columbus | Youngstown | Cleveland | Cincinnati";

У implode( ) имеется псевдоним — функция join( ).

strpos ( )

Функция strpos( ) находит в строке первый экземпляр заданной подстроки. Синтаксис функции strpos( ):

int strpos (string строка, string подстрока [, int смещение])



Необязательный параметр offset задает позицию, с которой должен начинаться поиск. Если подстрока не найдена, strpos( ) возвращает FALSE (0).

В следующем примере определяется позиция первого вхождения даты в файл журнала:

$log = "

206.169.23.11:/www/:2000-08-10

206.169.23.11:/www/logs/:2000-02-04

206.169.23.11:/www/img/:1999-01-31";

// В какой позиции в журнале впервые встречается 1999 год?

$pos = strpos($log, "1999");

// $pos = 95. поскольку первый экземпляр "1999"

// находится в позиции 95 строки, содержащейся в переменной $log

strrpos( )

Функция strrpos( ) находит в строке последний экземпляр заданного символа. Синтаксис функции strrpos( ):

int strpos (string строка, char символ)

По возможностям эта функция уступает своему двойнику — функции strpos( ), поскольку она позволяет искать только отдельный символ, а не всю строку. Если во втором параметре strrpos( ) передается строка, при поиске будет использован только ее первый символ.

str_replace( )

Функция str_replace( ) ищет в строке все вхождения заданной подстроки и заменяет их новой подстрокой. Синтаксис функции str_replace( ):

string str_replace (string подстрока, string замена, string строка)

Функция substr_replace( ), описанная ниже в этом разделе, позволяет провести заме ну лишь в определенной части строки. Ниже показано, как функция str_replace( ) используется для проведения глобальной замены в строке.

Если подстрока ни разу не встречается в строке, исходная строка не изменяется:

$favorite_food = "My favorite foods are ice cream and chicken wings";

$favorite_food = str_replace("chicken_wings", "pizza", $favohte_food);

// $favorite_food = "My favorite foods are ice cream and pizza"

strstr( )

Функция strstr( ) возвращает часть строки, начинающуюся с первого вхождения заданной подстроки. Синтаксис функции strstr( ):

string strstr (string строка, string подстрока)

В следующем примере функция strstr( ) используется для выделения имени домена из URL:



$url = "http://www.apress.com"; $domain - strstr($url, ".");

// $domain = ".apress.com"

substr( )

Функция substr( ) возвращает часть строки, начинающуюся с заданной начальной позиции и имеющую заданную длину. Синтаксис функции substr( ):

string substr (string строка, int начало [, int длина])

Если необязательный параметр длина не указан, считается, что подстрока начинается с заданной начальной позиции и продолжается до конца строки. При использовании этой функции необходимо учитывать четыре обстоятельства:



  • если параметр начало положителен, возвращаемая подстрока начинается с позиции строки с заданным номером;


  • если параметр начало отрицателен, возвращаемая подстрока начинается с позиции (длина строки - начало);


  • если параметр длина положителен, в возвращаемую подстроку включаются все символы от позиции начало до позиции начало+длина. Если последняя величина превышает длину строки, возвращаются символы до конца строки;


  • если параметр длина отрицателен, возвращаемая подстрока заканчивается на заданном расстоянии от конца строки.


  • Помните о том, что параметр начало определяет смещение от первого символа строки; таким образом, возвращаемая строка в действительности начинается с символа с номером (начало + 1).

    Следующий пример демонстрирует выделение части строки функцией substr( ):

    $car = "1944 Ford"; Smodel = substr($car, 6);

    // Smodel = "Ford"

    Пример с положительным параметром длина:

    $car = "1944 Ford";

    $model = substr($car, 0, 4);

    // $model = "1944"

    Пример с отрицательным параметром длина:

    $car = "1944 Ford";

    $model = substr($car, 2, -5);

    // $model = "44"

     substr_count( )

    Функция substr_count( ) возвращает количество вхождений подстроки в заданную строку. Синтаксис функции substr_count( ):

    int substr_count (string строка, string подстрока)

    В следующем примере функция substr_count( ) подсчитывает количество вхождений подстроки ain:

    $tng_twist = "The rain falls mainly on the plains of Spain";



    $count = substr_count($tng_twist, "ain");

    // $count = 4

    substr_replace( )

    Функция substr_replace( ) заменяет часть строки, которая начинается с заданной позиции. Если задан необязательный параметр длина, заменяется фрагмент заданной длины; в противном случае производится замена по всей длине заменяющей строки. Синтаксис функции substr_replace( ):

    string substr_replace (string строка, string замена, int начало [, int длина])

    Параметры начало и длина задаются по определенным правилам:



    • если параметр начало положителен, замена начинается с заданной позиции;


    • если параметр начало отрицателен, замена начинается с позиции (длина строки -начало);


    • если параметр длина положителен, заменяется фрагмент заданной длины;


    • если параметр длина отрицателен, замена завершается в позиции (длина строки -длина).


    • Простая замена текста функцией substr_replace( ) продемонстрирована в следующем примере:

      $favs = " 's favorite links";

      $name = "Alessia";

      // Параметры "0, 0" означают, что заменяемый фрагмент начинается

      // и завершается в первой позиции строки.

      $favs - substr_replace($favs, $name, 0, 0);

      print $favs:

      Результат:

      Alessia's favorite links


      Содержание раздела