Keelekorpus on lihtsustatult öeldes tekstide kogum. Enamik neist on tänapäeva kirjalikku keelt sisaldavad korpused, lisaks koostatakse mitmesuguseid erikorpusi, mis sisaldavad vanemat keelekasutust, murdekeelt, lastekeelt, suulist keelt jne. Suurim eesti keele korpus sisaldab 1,5 miljardit sõna.