The American National Corpus (ANC) project is creating a massive electronic collection of American English, including texts of all genres and transcripts of spoken data produced from 1990 onward. The ANC will provide the most comprehensive picture of American English ever created, and will serve as a resource for education, linguistic and lexicographic research, and technology development.

When completed, the ANC will contain a core corpus of at least 100 million words, comparable across genres to the British National Corpus (BNC). The corpus will also include an “opportunistic” component of potentially several hundreds of millions of words, chosen to provide both the broadest and largest selection of texts (and, where available, annotations) possible.

resource: American National Corpus. (2009, May 5). In American National Corpus, ANC. Retrieved 12:21, May 5, 2009, from http://americannationalcorpus.org/


Anuncios

Tags

What are tags?

Tags are one-word descriptors that you can assign to your bookmarks on Delicious to help you organize and remember them. Tags are a little bit like keywords, but you choose them yourself and they do not form a hierarchy. You can assign as many tags to a bookmark as you like and you can always rename or delete the tags later. So, tagging can be a lot easier and more flexible than fitting your information into preconceived categories or folders.

For example, if you save an article about how to make a certain kind of cake, you can tag it with recipes sweets yogurt or whatever other tags you might use to find it again. You don’t have to rely on the designer of a system to provide you with a category for French cake recipes. You make up tags as you need them, and use the tags that make the most sense to you.

This is great for organizing and finding personal data, but it goes even further when someone else posts related content using the same tags. You begin building a collaborative repository of related information, driven by personal interests and creative organization. 

What are some examples of tagging?

You can use tags describing an article or website’s subject, location, name, category, people, places, ideas — pretty much anything you can think of. The more tags the better! (Most people end up adding two to five tags to each of their bookmarks.)

The only limitation on tags is that they must not include spaces. So if your web page is about a two-word place like “San Francisco”, you may want to tag it as sf, san-francisco, SanFrancisco, san.francisco, or whatever else makes sense to you. You don’t want to use commas, though, since a comma will be become part of the tag. You can also use tags to describe metadata about the bookmark. For example, you can use asterisks to rate bookmarks. So a tag of * might mean an OK link, *** is pretty good, and a bookmark tagged ***** is awesome. Other common tags include toread, or via:friend. Bookmarks that you want can be tagged wishlist, and ones that might not be safe to visit at work can be tagged nsfw. A tag can be anything you want.

resources: http://delicious.com/help/faq

What is the BNC?

The British National Corpus (BNC) is a 100 million word collection of samples of written and spoken language from a wide range of sources, designed to represent a wide cross-section of British English from the later part of the 20th century, both spoken and written. The latest edition is the BNC XML Edition, released in 2007.

What sort of corpus is the BNC?

Monolingual: It deals with modern British English, not other languages used in Britain. However non-British English and foreign language words do occur in the corpus.

Synchronic: It covers British English of the late twentieth century, rather than the historical development which produced it.

General: It includes many different styles and varieties, and is not limited to any particular subject field, genre or register. In particular, it contains examples of both spoken and written language.

Sample: For written sources, samples of 45,000 words are taken from various parts of single-author texts. Shorter texts up to a maximum of 45,000 words, or multi-author texts such as magazines and newspapers, are included in full. Sampling allows for a wider coverage of texts within the 100 million limit, and avoids over-representing idiosyncratic texts.

Sources: NTB:  British National Corpus (BNC). (2009, April 4). In BNC, British National Corpus. Retrieved 09:27, April 15, 2009, from http://www.natcorp.ox.ac.uk/corpus/index.xml

A partir de hoy 20 de Noviembre, nos encontramos ante el nacimiento de Europeana, una nueva biblioteca digital, que ha sido creada con la colaboración de todos los miembros de la UE.

El proyecto comenzó el 1 de Febrero de este año cuando en Frankfurt se reunieron directores de museos, archiveros, editores y bibliotecarios, con la idea de reunir todo el material disponible y lanzar un recurso digital optimizado.

En ella se podrán encontrar textos, fotografías, vídeos, mapas, manuscritos, pinturas, periódicos y documentos históricos de archivo que según Vivianne Reading, Comisaria Europea para la Sociedad de la Información, alcanzará la cifra de 10 millones en 2010.

Por el momento, de los dos millones de documentos que contiene, España sólo ha aportado un 1,4% del total de la Unión Europea, frente al 10% de Reino Unido, el 10% de Holanda o el 52% de Francia.

Este proyecto, es una “pequeña‐gran” muestra de los trabajos que se realizan en el marco comunitario, teniendo un apoyo de la Comisión Europea que ha contribuido enormemente a través del programa eContentplus con proyectos como EDLproject que finalizó en febrero de 2008, EDLneAlineación a la izquierdat y TELplus.

 

Fuentes: http://jsacardena.blogspot.com/

http://www.europeana.eu/.

 

Tras seis meses en funcionamiento, Knol, la enciclopedia de Google tiene 100.000 artículos a su haber y está aun muy lejos de los 2,7 millones de artículos en inglés que mantiene Wikipedia. Pero ya se avisora un nuevo competidor para el popular sitio y se trata nada menos que de la Encyclopedia Britannica.

Los ingleses quieren fortalecer su versión online y abrirán sus puertas para que los usuarios contribuyan con artículos nuevos o puedan editar otros. Una vez enviada la contribución, esta será revisada por uno de los editores de la Encyclopedia Britannica antes de que las modificaciones aparezcan disponibles en el sitio web. Según Jorge Cauz, presidente de la institución, se han puesto una meta de 20 minutos para que las ediciones de artículos ya existentes -escritos por expertos remunerados-, se actualicen. Se espera que muchas de las modificaciones hechas a los artículos aparezcan luego en la versión impresa de la enciclopedia, la cual es publicada cada dos años.

 

EPOS Technologies lanza al mercado un bolígrafo digital que graba lo que vas escribiendo, esto lo hace mediante un sistema propietario de reconocimiento que va detectando los movimientos del bolígrafo mientras escribes, y los va transmitiendo inalámbricamente a una memoria flash para que se almacenen y luego descarguen a la computadora para su interpretación.

 

                                                  

                                                   

El programa malicioso, conocido como Conficker, Downadup, o Kido fue descubierto en octubre del 2008. A pesar del parche liberado por Microsoft, ya hay más de 3,5 millones de computadoras infectadas.

Una vez en tu computador, el gusano busca el archivo ejecutable de Windows llamado "services.exe" y luego pasa a formar parte de dicho código.

Luego se copia en la carpeta del sistema de Windows como un archivo del tipo"dll", se retitula con un nombre de entre 5 y 8 caracteres cómo "piftoc.dll", modifica el registro de Windows para finalmente ejecutar el archivo "dll" infectado como un servicio del sistema.

Una vez que el gusano está instalado, crea un servidor HTTP, borra rastros de su instalación y comienza a bajar programas y archivos de sitios maliciosos.

Pero el Downadup tiene una inteligencia adicional, ya que usa un complicado algoritmo que genera miles de nombres de dominio diferentes cada día, como por ejemplo mphtfrxs.net,imctaef.cc,hcweu.org, etc… pero sólo uno de ellos es válido y es el que realmente usa para conectarse a la nave madre. Esta estrategia hace casi imposible rastrear sus quehaceres.

Fuente; http://www.fayerwayer.com