69702

Функції для роботи з окремими символами

Лекция

Информатика, кибернетика и программирование

При зміні регістра російських букв можуть виникнути проблеми, уникнути яких допоможе правильна установка локали. Локалью називатимемо сукупність локальних настройок системи, таких як формат дати і часу, мова, кодування.

Украинкский

2014-10-09

74 KB

0 чел.

Тема 22: Функції для роботи з окремими

символами

Як і в інших мовах програмування, в PHP ми можемо працювати з символами рядка окремо. Звернутися до будь-якого символу рядка можна по його індексу:

$str   =   "Book";

echo   $str[0]; //   виведе   В

Якщо ви програмували на мові Pascal, вам повинні бути знайомі функції chr() і ord(). У PHP ці функції працюють майже так само, як і в Паскалі. Функція chr(int Scode) повертає рядок, що складається з символу з кодом $code, а функція ord(Schar) — код символу $char:

echo   chr(75); //   виведе.До

echo   ord('A');    //   виведе   65   -   код   букви  А

Досить цікавою є функція strrpos(string $str, char $chr). Хоча вона і схожа назвою на strpos(), але вона виконує абсолютно інші дії. Вона шукає останнє входження символу $chr у рядок $str. Якщо рядок $chr складається з більш за один символ, то буде використаний перший з них.

9.5. Зміна регістра символів. Установка і настройка локали

Для перекладу символів рядка в нижній регістр використовується функція strtolower(), а у верхній - strtoupper():

$str   =   strtolower($str); $str   =   strtoupper($str);

При зміні регістра російських букв можуть виникнути проблеми, уникнути яких допоможе правильна установка локали. Локалью називатимемо сукупність локальних настройок системи, таких як формат дати і часу, мова, кодування.

Настройки локали дуже залежать від операційної системи, тому якщо у вас удома все працює нормально, то це зовсім не означає, що так і буде на машині вашого хостинг-провайдера.

Для установки локали використовується функція SetLocale(), якою слід передати два параметри — категорію встановлюваних параметрів илокаль. Категорія може бути наступною:

LC_TYPE — використовується для установки локали перекладу символів
нижний/верхний регістри (якраз те, що нам потрібне).

LC_NUMERIC — використовується для установки локали для функції
форматування дробових чисел.

LC_TIME — допомагає набудувати форматоване виведення дати і
часу.

LC_ALL — встановлює всі вищеперелічені режими.

Ми не розглядатимемо всі категорії, а зупинимося на категорії LC_TYPE, яка зараз потрібна нам. Будь-яка локаль, встановлена в системі, має своє унікальне ім'я, по якому можна до неї звернутися. Категорія LC_TYPE встановлює локаль для перетворення символів. Ім'я активізованої локали для категорії LC_TYPE міститься в елементі з ключем LANG масиву GLOBALS (це змінна оточення LANG). У моєму випадку — це ru_RU.koi8. Для коректного перетворення символів на моїй машині потрібно виконати функцію:

SetLocale('LC_TYPE\'    ru_RU.koi8    ');

Якщо ви працюєте під Linux, в більшості випадків вас влаштує даний виклик (якщо, звичайно, ви використовуєте кодування koi8-r). В більшості випадків (у сучасних дистрибутивах), локаль вже настроєна до вас, тому перед її зміною за допомогою SetLocale(), слід спочатку переконатися, що параметри настроєні неправильно. На моїй машині із самого початку все було нормально, тому я не змінював локаль.

9.6. Перетворення символів

Функції видалення пропусків

У загальному випадку абсолютно неможливо передбачити, що може ввести в поле введення користувач. Іноді навіть сам користувач не може пояснити, чому він ввів це. Проте скрипт, якщо він створений добротно, повинен уміти розібратися в наданих йому даних. Або принаймні спробувати це зробити. Спеціально для цього в PHP передбачений цілий ряд функцій.

Після прийому параметрів, перш ніж приступити до їх обробки, потрібно перетворити значення параметрів до «товарного вигляду». Перш за все, потрібно видалити зайві пропуски. Функція trim() видаляє пробільні символи на початку і в кінці рядка, наприклад:

$s   =   "   string\n";

$s   =   trim($s);   //   $s   =   "string"

Нагадаю, що пробільними символами вважаються символи " ",\n,\r,\t. Окрім функції trim() можна використовувати функції ltrim() і chop(). Перша видаляє пробільні символи тільки на початку рядка, а друга -только в її кінці.

URL-кодування і декодування

Дуже корисними є функції Url-кодування і декодування даних. Так, функція UrlEncode() використовується для кодування даних. Кодування необхідне, якщо вам потрібно передати дані, содержаиче спеціальні символи або символи національних алфавітів, наприклад, символів російської або української мов. Url-кодування необхідне для передачі даних через інтернет, наприклад, таке кодування доцільне, якщо ви хочете передати російськомовну інформацію як параметр сценарію. Якщо ви хочете передати цілий файл, його також бажано закодувати за допомогою функції UrIEncode(), а потім розкодувати за допомогою UrlDecode(), щоб потім не вийшло непорозуміння. А вони можуть виникнути через банальну відсутність підтримки сервером 8-бітових кодувань.

Ось приклад автоматичного формування посилання <а href>:

$Param   =   "Російський   текст";

echo   "<a   href=http://locahost/

script.php?parametrs = ".UrlEncode($Param) .">Click   here</a>";

У лістингу 9.5 приведений приклад, що демонструє спільну роботу функцій UrIEncode() і UrlDecode:

Лістинг 9.5. Демонстрація спільної роботи функцій UrlEncode() і UrlDecode

<?

$Param = "Російський текст";

$Param = UrlEncode($Param);

echo "$Param\n";

$Param   =   UrlDecode($Param);

echo   "$Param\n";

?>

Рядок "Російський текст" (див. мал. 9.2) була перетворена в не зовсім зрозумілу послідовність символів, символ пропуску був замінений символом +. У такому вигляді рядок готовий до передачі по Усесвітній павутині. Функція UrlDecode() безболісно перетворила страшну после-

довательность символів в початковий рядок. Нагадаю, що кодування вимагають тільки параметри сценарію, якщо вони містять спеціальні символи або символи національних алфавітів.

Окрім функції UrIEncode() і UrlDecode() ви можете використовувати функції RawUrlEncode() і RawUrIDecode(). Ці функції працюють аналогічно попереднім, але не сприймають символ «+», як пропуск.




Мал. 9.2. Функції   UrlEncode() і UrlDecode

Використання слэшей

Ви знаєте, що для виведення лапок або похилої межі, потрібно використовувати цитування, тобто, запис цих символів через похилу межу:


$S   =    "\ echo   $S;

 \


Рано чи пізно, вам буде потрібно додати перед вказаними символами (або ж, навпаки, видалити) зайві слэши. Для додавання слэшей використовується функція AddSlashes(string $str), а для видалення — StripSlashes(string $str). Обидві функції повертають модифікований рядок і не змінюють результатну.

Заміна спеціальних символів на їх HTML-еквіваленти

Функція HtmlSpecialChars(string $str) замінює спеціальні символи (лапки, «більше», «менше» та інші) на їх HTML-еквіваленти. Робиться це для того, щоб вони на Web-сторінці виглядали самими собою.

Наприклад при використанні функції HtmlSpecialChars, знак «більше» в коді буде замінений рядком &gt, а лапки — &quot. Приклад використання HtmlSpecialChars приведений в лістингу 9.6.

Лістинг 9.6. Приклад використання HtmlSpecialChars

<?

$S   =   "&   <   >   \"";

$S =  HtmlSpecialChars($S);

echo $S;     // виведе &amp; slt; &gt; &quot;

?>


 

А также другие работы, которые могут Вас заинтересовать

37407. Исследование источника вторичного электропитания на базе однофазной мостовой схемы выпрямления 132.5 KB
  Цель работы: Изучение принципа работы и параметров источника вторичного электропитания на базе мостовой схемы выпрямителя.
37408. Методика проведения исследований на переносном испытательном стенде 3.6 MB
  Содержание работы: В работе исследуются тепловое реле контакторы постоянного тока и переменного токов автоматические выключатели. Блок К1 включает в себя контактор переменного тока серии А с предустановленным тепловым реле перегрузки ТА25DU н. Блок К2 включает в себя контактор переменного тока серии А н. Блок К3 включает в себя контактор постоянного тока серии ВС кнопки ПУСК S5 и СТОП S6 гнезда осциллографа тумблеры S14 и S15 выводы для подключения таймера и .
37409. ТЕКСТОВЫЙ ПРОЦЕССОР MICROSOFT WORD 784.5 KB
  СОЗДАНИЕ ФОРМАТИРОВАНИЕ И СОХРАНЕНИЕ ДОКУМЕНТА. Используя команду меню Вид  Панели инструментов отключите панели инструментов Форматирование и Стандартная. Отформатируйте тексты абзацев с помощью панели инструментов Форматирование установив шрифт Courier New размер шрифта 13 начертание – курсив выравнивание – по ширине межстрочный интервал – полуторный. Сохраните документ в файле на диске : под именем Форматирование.
37410. Интерфейс WINDOWS, общие WINDOWS соглашения 506.5 KB
  Создайте на диске А: D: папку с любым именем. скопируйте 56 смежных файлов папки не включать в свою папку на диске А: D:. Скопируйте с рабочего стола 24 объекта исключая системные папки и документ LB_WIN в свою папку на диске А: D:. Скопируйте Вашу папку со всем содержимым с диска А: D: на D: Выведите содержимое скопированной папки на правой панели.
37411. РОЛЬ ГОСУДАРСТВА В РЫНОЧНОМ ХОЗЯЙСТВЕ 104.5 KB
  Ограниченность рыночного саморегулирования в решении многих важных экономических и социальных задач требует на определенном уровне развития рыночного хозяйства вмешательства государства в экономику. Цели государственного регулирования состоят в стимулировании экономического роста
37412. Экономическое обоснование освоения выпуска новой продукции (изделия) 765 KB
  Формирование плана производства и реализации продукции [3. Расчет себестоимости и рентабельности товарной продукции [3. ЗАДАНИЕ НА ПРОЕКТИРОВАНИЕ Необходимо определить экономическую целесообразность перехода на выпуск нового вида продукции ориентируясь на показатели рентабельности продукции и производства.
37413. Сестринский процесс при заболеваниях кишечника 517.26 KB
  Заболевания кишечника 5 1. Этиология и эпидемиология 5 Патогенез 6 Классификация 7 Клиническая картина 8 Осложнения 10 Неотложная помощь 11 Диагностика 11 Лечение 13 Профилактика прогноз 17 Сестринский процесс при заболеваниях кишечника 18 2. Выводы 26 Заключение 27 Литература 28 Приложения 29 ВВЕДЕНИЕ Актуальность темы: Актуальность темы определяется тем что лечение заболеваний кишечника и функциональных нарушений является нелегкой задачей.
37414. Сестринский процесс при холецистите 763 KB
  Актуальность темы К сожалению многие крайне легкомысленно относятся к диагнозу холецистит мало уделяют внимания первым симптомам холецистита подолгу терпят боль избегая посещения специалистов. Это опасная игра ведь если своевременно диагностировать и приступить к лечению холецистита возможно избежать очень опасных осложнений. Воспаление желчного...