NAME Cyrillic::CPdetect - Модуль для автоматического распознавания русских кодировок. SYNOPSIS use Cyrillic::CPdetect; $cp = Cyrillic::CPdetect->cp_detect( $test_string, $debug, @cp ); Возвращает имя кодировки или undef если определить не удалось. $test_string Строка по которой определяется кодировка. $debug 1 или 0. Если 1 то включена отладочная информация. @cp Список кодировок с которыми происходит сравнение $test_string. По умолчанию: KOI8-R, CP1251, IBM866. Доступны: KOI8-R, CP1251, IBM866, ISO- 8859-5, MAC-UK, IBM855, UTF8 ( в качестве эксперимента, т.к. в ISO-8859-5 куча похожих символов, да еще и в 2 раза больше по сути... ). DESCRIPTION Для выбора типа определения кодировки используется переменная $Cyrillic::CPdetect::DETECT_TYPE, при установки ее в значение 1 первичным при определении кодировки является количество совпавших пар символов из %TABLE, при установке этого значения в 2 первичным является сумма баллов набранная символами входящими в тестируемую строку согласно данным из %TABLE. По умолчанию $DETECT_TYPE = 2 Еще одна переменная: $Cyrillic::CPdetect::COMPRESS_STR - если 1 ( по умолчанию ) то все символы в тестовой строке повторяющиеся более трех раз ( аааасвввв ) 'сжимаются' бо 2 ( аасвв ), сделано для борьбы с досовской псевдографикой. Выигрыш в скорости составит ~ 10% при отключении данной фичи, зато на некоторых текстах может глючть. AUTHOR Okunev Igor V. mailto:igor@prv.mts-nn.ru http://www.mts-nn.ru/~gosha REVISION $Id: Read_me.txt,v 1.6 2002/12/03 21:56:31 gosha Exp $ -------------------------------------------------------------------------- NAME Cyrillic::CPconvert - Модуль для конвертации из одной русской кодировки в другую. SYNOPSIS use strict; use Cyrillic::CPconvert; my @CODEPAGES = Cyrillic::CPconvert->list(); my $string = 'привет'; my $new_string; my $ptr; foreach my $cp ( @CODEPAGES ) { $ptr = Cyrillic::CPconvert->new('KOI8-R',$cp); next unless defined $ptr; $new_string = $string; $ptr->($new_string); print "String[ $string ] => $cp = '$new_string'\n"; undef &$ptr; } DESCRIPTION * list - возвращает список доступных кодировок. * $ptr = $new($from,$to) - возвращает указатель на процедуру перекодировки. $from перекодировать из.. $to перекодировать в... * $ptr->($sting) - перекодирует строку $string AUTHOR Okunev Igor V. mailto:igor@prv.mts-nn.ru http://www.mts-nn.ru/~gosha REVISION $Id: Read_me.txt,v 1.6 2002/12/03 21:56:31 gosha Exp $