1298
Capítulo 30 Cadenas, caracteres y expresiones regulares
30.1 Introducción
En este capítulo presentamos las herramientas para el procesamiento de cadenas y caracteres en Java. Las técnicas
que se describen aquí son apropiadas para validar la entrada en los programas, para mostrar información a los
usuarios y otras manipulaciones basadas en texto. Estas técnicas son también apropiadas para desarrollar editores
de texto, procesadores de palabras, software para el diseño de páginas, sistemas de composición computarizados
y demás tipos de software para el procesamiento de texto. Ya hemos presentado varias herramientas para el proce-
samiento de texto en capítulos anteriores. En este capítulo describiremos detalladamente las herramientas de las
clases
String
,
StringBuilder
y
Character
del paquete
java.lang
, y la clase
StringTokenizer
del paquete
java.util
. Estas clases proporcionan la base para la manipulación de cadenas y caracteres en Java.
En este capítulo también hablaremos sobre las expresiones regulares que proporcionan a las aplicaciones la
capacidad de validar los datos de entrada. Esta funcionalidad se encuentra en la clase
String
, junto con las clases
Matcher
y
Pattern
ubicadas en el paquete
java.util.regex
.
30.2 Fundamentos de los caracteres y las cadenas
Los caracteres son los bloques de construcción básicos de los programas fuente de Java. Todo programa está
compuesto de una secuencia de caracteres que, cuando se agrupan en forma signifi cativa, son interpretados por
la computadora como una serie de instrucciones utilizadas para realizar una tarea. Un programa puede contener
literales de carácter
. Una literal de carácter es un valor entero representado como un carácter entre comillas
simples. Por ejemplo,
'z'
representa el valor entero de
z
, y
'\n'
representa el valor entero de una nueva línea.
El valor de una literal de carácter es el valor entero del carácter en el
conjunto de caracteres Unicode
. En el
apéndice B se presentan los equivalentes enteros de los caracteres en el conjunto de caracteres ASCII, el cual es
un subconjunto de Unicode (que veremos en el apéndice I). Para obtener información detallada sobre Unicode,
visite
www.unicode.org
.
30.1
Introducción
30.2
Fundamentos de los caracteres y las cadenas
30.3
La clase
String
30.3.1
Constructores de
String
30.3.2
Métodos
length
,
charAt
y
getChars
de
String
30.3.3
Comparación entre cadenas
30.3.4
Localización de caracteres y subcadenas en las cadenas
30.3.5
Extracción de subcadenas de las cadenas
30.3.6
Concatenación de cadenas
30.3.7
Métodos varios de
String
30.3.8
Método
valueOf
de
String
30.4
La clase
StringBuilder
30.4.1
Constructores de
StringBuilder
30.4.2
Métodos
length
,
capacity
,
setLength
y
ensureCapacity
de
StringBuilder
30.4.3
Métodos
charAt
,
setCharAt
,
getChars
y
reverse
de
StringBuilder
30.4.4
Métodos
append
de
StringBuilder
30.4.5
Métodos de inserción y eliminación de
StringBuilder
30.5
La clase
Character
30.6
La clase
StringTokenizer
30.7
Expresiones regulares, la clase
Pattern
y la clase
Matcher
30.8
Conclusión
Resumen | Terminología | Ejercicios de autoevaluación | Respuestas a los ejercicios de autoevaluación | Ejercicios
Sección especial: manipulación avanzada de cadenas | Sección especial: proyectos desafi antes de manipulación de cadenas
Plan gener
al
30_MAQ_CAP_30_DEITEL.indd1298
5/8/084:22:29PM