В базе данных находятся таблицы, в таблицах поля.
Открываете таблицу, где находяться нужные данные, находите текстовые поля, бывают сортируемые (char и varchar) с указанием длинны и несортируемые (text, longtext), у этих полей кодировка должна быть установлена "utf8_general_ci".
Настройка параметров кодировок MySQL состоит из нескольких этапов.
Кодировка (character set) и представление (collation) сервера
1. Кодировка (characher set) – набор используемых символов.
2. Представление (collation) – набор правил для сравнения символов в наборе.
Основные параметры используемые в контексте сервера — это character_set_server и collation_server. Оба параметра влияют на определение кодировки и отображения сервера MySQL.
Можно задать оба параметра либо только один из них:
- Не заданы оба, используются значения по умолчанию (дефолтные - latin1 и latin1_swedish_ci);
- Заданы оба, используются указанные кодировка и ее представление;
- Задана только кодировка, представление выставляется по умолчанию для данного типа кодировки.
Это значит, для каждого типа кодировки есть ее дефолтное представление, например, для сервера "latin1", а отображение для нее "latin1_swedish_ci".
Посмотреть соответствие кодировки и ее дефолтного представления можно используя команду:
SHOW COLLATION LIKE ‘your_character_set_name’;
Кодировка (character set) и представление (collation) базы данных
Есть два варианта иницилизации:
1. При выполнении запроса на создание базы данных:
CREATE DATABASE db_name CHARACTER SET utf8 COLLATE utf8_general_ci;
2. Через переменные character_set_database и collation_database. Эти переменные нельзя задать явно ни в командной строке ни в конфигурационном файле.
Кодировка (character set) и представление (collation) таблиц
Задать кодировку и ее представление можно так:
CREATE TABLE t1 (xxxx)
CHARACTER SET utf8 COLLATE utf8_unicode_ci;
Если настройки не заданы, то берутся настройки базы данных.
Кодировка (character set) и представление (collation) внутри таблиц
col1 VARCHAR(64) CHARACTER SET utf8 COLLATE utf8_unicode_ci
Если кодировка не указана, берется кодировка таблицы.