An Exploratory Analysis of a Small Corpus of Spoken Omani Arabic

Videos, audio files, texts and scripts used to produce and analyse a small corpus of spoken Arabic in the dialect of Oman


Buckwalter (MSA) Schmid (OA) NGSL

1999-02-01 2001-02-01 2002-08-01 2015-07-12 2013
Rank Word Freq. Word File count Word File count Word Freq. Word
1 في 5,645,218 من 1,144,319 من 2,511,236 ال 153 the
2 من 3,871,153 في 1,128,546 في 2,422,564 و 77 be
3 على 2,310,879 على 915,406 على 1,996,755 الله 45 and
4 ان 2,219,600 عن 776,762 عن 1,684,706 ب 38 of
5 الى 1,516,247 ان 748,416 ان 1,637,296 ما 28 to
6 التي 1,072,702 التي 733,062 التي 1,625,725 على 27 a
7 عن 933,872 الى 666,316 الى 1,424,032 قال 27 in
8 الذي 727,170 الذي 645,854 الذي 1,406,014 في 26 have
9 مع 673,928 مع 618,865 مع 1,401,634 ان 25 it
10 هذا 664,751 هذا 562,428 هذا 1,216,084 لا 23 you
11 هذه 621,972 هذه 533,077 هذه 1,167,126 ل 21 he
12 ما 614,348 ما 516,655 بعد 1,119,473 من 20 for
13 لا 596,737 بين 498,405 بين 1,103,814 انا 17 they
14 بين 471,859 بعد 498,352 ما 1,102,480 يا 16 not
15 أن 444,508 لا 448,718 خلال 983,953 مو 14 that
16 ذلك 390,446 خلال 433,457 كما 952,957 هذا 14 we
17 كان 385,909 كما 429,963 لا 949,315 اه 13 on
18 بعد 383,454 كل 415,445 أن 944,445 هذه 13 with
19 كل 372,917 ذلك 414,018 كل 876,683 ف 12 this
20 لم 347,762 أن 395,224 ذلك 874,247 كان 12 i
21 إلى 336,817 كان 392,905 كان 828,361 انت 11 do
22 بن 330,130 لم 378,694 لم 817,968 سليمان 11 as
23 كما 316,837 حيث 349,694 وقال 805,975 حمد 10 at
24 او 300,602 العام 348,480 قد 795,319 امر 9 she
25 هو 299,244 قبل 348,359 رئيس 781,413 تو 9 but
26 خلال 297,653 رئيس 346,054 العام 781,323 تعالى 8 from
27 العربية 289,300 وفي 344,874 حيث 777,851 راح 8 by
28 انه 269,280 وقال 344,420 قبل 767,380 كيف 8 will
29 العام 268,549 قد 343,512 اليوم 765,200 لكن 8 or
30 الله 267,092 وقد 343,123 وفي 713,037 يعني 8 say