Так все просто! Всего то нужно проверить длину символа... Ну и запастись некоторыми знаниями о кодировках
К примеру латиница кодируется одним байтом (1 байт = 1 символ), а Юникод символы кодируются от 2х до 4х байт (1 символ может состоять как из 2х, так и из 3х, так и из 4х байт) поэтому метод рабиения строки побайтово для юникода не подойдет.