Digido testunau a llyfrau sain Cymraeg

Rhifyn cyntaf Eco’r Wyddfa – Chwefror 1976

Tynnwyd fy sylw’n ddiweddar at archif arlein o Eco’r Wyddfa. Ffeiliau PDF – sganiau o hen gopïau print, gyda phob tudalen yn llun. Y peth sy’n anffodus gyda ffeiliau yn y fformat hwn yw’r anallu i chwilio drwyddynt. Nid oes modd agor y ffeil a gwasgu ‘Ctrl + F’, ac nid yw Google yn gallu ei ychwanegu i’w fynegai chwaith.

Cafodd gopïau gwreiddiol o Eco’r Wyddfa eu sganio. I’r rheiny wnaeth brynu sganiwr blynyddoedd yn ôl, bosib i chi gofio defnyddio cyfleuster ‘Scan to Text’. Sganio dogfen gyda thestun arni, ac yn lle bod y testun yn rhan annatod o’r ddelwedd, ei bod yn destun a all gael ei olygu mewn meddalwedd fel Word. Yr enw ar y gallu hwn yw Optical Character Recognition (OCR) / Adnabod Llythyren Optegol (ALlO). Doedd y dechnoleg ddim yn llwyddiannus iawn ar y pryd, ac yr oedd hi’n aml yn gyflymach teipio’r testun o’r newydd yn lle cywiro’r holl wallau!

Gyda sganwyr Hewlett Packard (HP), yr oedd eu meddalwedd ‘Scan to Text’ wedi ei adeiladu ar graidd Tesseract. Rhyddhaodd HP Tesseract o dan drwydded agored yn 2005, ac ers hynny mae Google a chyfranwyr eraill wedi ei ddatblygu ym mhellach gyda chynnydd mawr. Nid Tesseract yw’r unig feddalwedd sydd ar gael – mae eraill fel ABBYY – ond mae’n agored, am ddim, ac yn cefnogi’r Gymraeg. Gall Tesseract wneud dau beth: adnabod unrhyw destun mae’n synhwyro a’i roi mewn ffeil destun, neu greu ffeil PDF gyda llun o’r sgan fel cefndir a haen gyda thestun chwiladwy ar ei ben.

Mae Llyfrgell Genedlaethol Cymru wedi bod yn defnyddio meddalwedd ALlO ers blynyddoedd i greu adnoddau gwych fel Cylchgronau Cymru. Ond ni allem ddisgwyl i’r Llyfrgell Genedlaethol wneud popeth.

Wedi sôn am Eco’r Wyddfa, dyma brofi sut i adnabod y testun mewn sganiau o bapur bro’r Wyddgrug, Papur Fama, a chreu PDF. (Yr oedd copïau yn y garej.) Cam pwysig iawn i wneud yn siŵr bod y testun yn cael ei adnabod yn gywir, yw bod gan y sgan cydraniad uchel (300 dpi yn lle 72 dpi mwy cyffredin), a chyferbyniad amlwg rhwng y cefndir a’r testun; cefndir gwyn, a thestun du – lefelau tonyddol y golau. Bydd hyn yn arwain at ffeiliau gyda meintiau mawr.

Dyma fy nghamau:

  • Cafodd y lefelau tonyddol eu gosod gyda fy meddalwedd sganio, ond mae’n bosib ei wneud gyda phecyn fel Photoshop, GIMP, ImageMagick etc.
  • Fesul un sganio pob tudalen a chreu ffeil llun.
  • Creu ffeil efo cyfeiriad i bob ffeil fesul llinell newydd
  • Rhedeg Tesseract.
tesseract rhestr_lluniau.txt ffeil_1 -l cym+eng PDF

Rhedeg Tesseract, nodi pa ffeiliau i’w defnyddio, nodi enw’r ffeil allbwn, nodi geiriau pa ieithoedd i geisio’u hadnabod, nodi fy mod eisiau ffeil PDF. Ar ôl creu pob PDF, fe wnes i eu golygu i leihau maint y lluniau. Yr oedd eu hangen yn fawr i gychwyn, fel bod modd eu darllen gan y cyfrifiadur. Bellach, mae’r testun wedi ei hadnabod a maint y ffeil yn fawr iawn.

Dyma ddau rifyn o Papur Fama – Mai 1991 a Rhagfyr 1992.

Papur Fama Mai 1991

Papur Fama Rhagfyr 1992

Mewn darllenydd PDF, os bwyswch ‘Ctrl + A’ gallwch weld y testun sydd wedi ei adnabod o fewn y sgan, ac sydd bellach mewn haen ar wahân yn y ffeil; sylwch nad yw’r testunau mewn bocsiau llwyd wedi eu hadnabod. Gallwch chwilio trwy’r ddogfen rŵan hefyd gyda ‘Ctrl + F’. Llwyddiant!

Ffordd dda o geisio rhoi mwy o’r Gymraeg ar y we!

 

Cam dau

Un gwefan dwi’n mwynhau ei ddarllen yw un Lowri Haf Cooke. Yn aml mae hi’n cyfrannu i gyhoeddiadau print, gyda hi’n rhoi llun o’r cyhoeddiad ar ei gwefan. Fel uchod, nid yw hi’n bosib chwilio’r geiriau. Ni fydd y testun mewn llun o erthygl yn Y Dinesydd yn ymddangos mewn chwiliadau Google.

Felly dyma roi’r llun o erthygl Bwytai Merch y Ddinas – Hoffi Coffi trwy Tesseract. Yr unig wahaniaeth y tro hwn yw peidio nodi fy mod eisiau ffeil PDF. Bydd yn creu ffeil destun gyda’r ysgrifen a adnabyddir.

Erthygl Lowri Haf Cooke yn Y Dinesydd

 

Nid dyna, bob tro, oedd fy mhrofiad
rai blynyddoedd yn ôl, wrth ymchwilio ì
nghyfrol cyntaf, Canllaw Bach
Caerdydd. Mae ‘na un caffi amlwg ger
llyn y Rhath sy’n dal i ‘nghorddi pan
lonciaf heibio iddo. Lleoliad gorau’r
ddinas, ond gweledigaeth ddi-fflach,
syn crynhoi diffyg uchelgais y
ddinas (tan yn ddiweddar) i’r dim.
Cofiaf sgwrsio â pherchennog tŷ te
Gerddi Waterloo – oedd newydd
agor ar y pryd — oedd yn dyheu am

Dolen at y ffeil llawn.

Un o’r problemau a welwn yma yw, er mor dda yw Tesseract am adnabod colofnau a darnau o destun wedi eu gosod yma ac acw, mae’n adnabod y testun yn union. Hynny yw, mae’n hollti pob llinell fel y mae heb allu deall mai’r un frawddeg sy’n llifo. Ond petai’r testun a echdynnir yn cael ei roi ochr yn ochr â’r llun gwreiddiol, bydd dal modd canfod y dudalen gyda chwiliadau Google…

 

Cam tri

Gyda’r Eisteddfod Genedlaethol wythnos nesaf, un o’r digwyddiadau a drefnwyd gan Comisiynydd Cenedlaethau’r Dyfodol Cymru yw “A ddylai robotiaid siarad Cymraeg?” Be am drio?

Gwasanaethau yn y cwmwl yw’r cyfle i bobl a busnesau cyffredin fanteisio ar isadeiledd cyfrifiadurol enfawr cwmnïoedd fel Salesforce, Google, Amazon, Microsoft etc. Maent oll yn ceisio datblygu technolegau deallusrwydd artiffisial, gydag un ohonynt yn wasanaeth trosi testun i sain. Enw’r gwasanaeth mae Amazon (AWS) yn ei gynnig yw Polly. Mae’n cefnogi sawl iaith gyda lleisiau dyn neu wraig, gan gynnwys y Gymraeg.

Dyma fwydo rhan o’r testun a echdynnwyd o erthygl Y Dinesydd uchod, a chreu’r clip sain isod. Gwyneth AWS sy’n ei llefaru. Safon ddealladwy a digon derbyniol, ond mae’n amlwg na chyfrifiadur sydd wedi creu’r sain.

 

Mae’r uchod yn dangos sut gall y Gymraeg gael ei ddigido a’i ledaenu. Ysgrifen safonol a diddorol sy’n sownd mewn print, gyda’r gallu i ffeindio’i ffordd i’r we ac yn chwiliadwy i bawb. I’r rheiny sydd heb amser, cyfle i wrando ar gynnwys Cymraeg, neu adnoddau defnyddiol iawn i ddysgwyr.

I gloi, dyma tair brawddeg cyntaf y llyfr Ymarfer Ysgrifennu gan Gwyn Thomas:

Y mae cywirdeb iaith yn hollbwysig. Cwynir yn gyffredinol heddiw fod safon Cymraeg ysgrifenedig wedi dirywio’n enbyd. Ymddengys fod ein Cymraeg llyfr, yn ogystal â’n Cymraeg llafar, yn frith o idiomau Seisnig, diffyg treigladau, cystrawennau chwithig a chamgymeriadau sillafu.

 

 

(Gallwch gael cipolwg ar sut mae Tesseract yn gweithio yn y papur adolygiadol hwn.)

Posted in Uncategorized | Leave a comment

Data mawr Cambridge Analytica

Yn ôl ymchwiliadau Newyddion Channel 4The Guardian, mae cwmni Cambridge Analytica wedi casglu data personol heb ganiatâd, proffilio pobl yn seicolegol, ac wedyn eu targedu gyda hysbysebion manwl. Crëwyd ffeithiau a newyddion ffug – celwydd – i ategu honiadau yn yr hysbysebion. Un o’u hymgyrchoedd oedd cymell pobl i bleidleisio o blaid gadael yr Undeb Ewropeaidd (UE).

Casglu gwybodaeth heb ganiatâd

Platfform data yw Facebook – nid yw’n creu cynnwys – mae’n casglu ein data personol a’i werthu. Trwy ei ddefnyddio yr ydym yn cytuno i hyn – ar y lleiaf trwy dderbyn hysbysebion; ar y mwyaf (hyd y gwyddwn) i rannu ein data gyda busnesau eraill.

Trwy ddefnyddio ‘ap’ neu raglen a grëwyd gan Cambridge Analytica ar blatfform Facebook, mae pobl wedi cytuno i rannu eu gwybodaeth bersonol. Mae rheoliad llac Facebook, wedi galluogi Cambridge Analytica i gasglu gwybodaeth gan gyfeillion y bobl sydd yn defnyddio’i rhaglen – heb iddynt wybod. Petai 100 o bobl wedi defnyddio’r rhaglen, a phob un o’r 100 efo 1,000 o gyfeillion, mae Cambridge Analytica wedi casglu data ar (100 x 1000) 100,000 o bobl, er na dim ond 100 o bobl sydd wedi caniatáu hyn. Y ffigwr a adroddwyd yn y newyddion yw hyd at 57 miliwn (57,000,000) o bobl.

Hysbysebu wedi ei dargedu

Caiff ein data ei ddefnyddio i dargedu’r hysbysebion yr ydym yn ei weld. Petaech yn nodi eich bod wedi dyweddïo, byddwch yn gweld hysbysebion priodas; petai Facebook yn synhwyro eich bod yn Nolgellau – unai trwy ddarllen eich mewnbwn am dref gartref neu ganfod cyfesurynnau GPS – fe welwch hysbyseb am fwyty newydd yn Nolgellau. Bydd busnes yn gosod hysbyseb ar Facebook gan nodi ei chynulleidfa, a Facebook yn unig sy’n penderfynu pwy sydd yn ei weld heb ddangos y data i’r busnes. Mae hyn yn creu incwm sylweddol, gyda’r disgwyl y bydd Facebook yn ennill dros $20 biliwn ($20,000,000,000) eleni. Ond mae cwmnïoedd yn barod i dalu mwy i gael y data i’w hunain.

Yn wybodus i bobl neu beidio, mae eich gweithgareddau digidol yn creu pob math o ddata. Gall y data fod yn gyfoethog iawn, sef negesuon a ysgrifennir neu luniau a rennir. Be bynnag fo cyfoeth y data, mae meta-data ar gael, sef data am y data. Er enghraifft, gall meta-data gynnwys y wybodaeth hyn am berson sy’n ymweld a gwefan: math o gyfrifiadur (Android, iPhone, Windows); beth yw iaith y dyfais (Cymraeg, Saesneg); yr amser a’r dyddiad; cyfeiriad IP sydd yn rhoi ryw syniad o leoliad y dyfais. Yn aml caiff meta-data ei ddefnyddio i gael argraff o’r gynulleidfa sydd yn ymweld a gwefan, a hyn ar ben unrhyw ysgrif/llun a rannwyd.

Gyda meta-data syml a rhestr o’r tudalennau mae person yn ei ddilyn, techneg digon syml yw cyfrifo faint o bobl yn nalgylch Caerdydd sydd yn dilyn tudalen Gadael neu Aros. Gall hysbysebion gael eu targedu at drigolion sydd, unai wedi nodi eu bod yn byw yng Nghaerdydd neu’n ymweld gwefan gyda chyfeiriad IP ardal Caerdydd.

Proffilio seicolegol a newyddion ffug

I broffilio person mae angen casglu cymaint o ddata a phosib, i gael darlun llawn o’u hoffterau a theimladau. Fel rheol mae pynciau’n gysylltiedig. Dyma broffiliau o bobl Aros a Gadael, sy’n ail-adroddiad o gynnwys gwefannau megis The Financial Times.

Aros Gadael
Poeni dim am fewnfudo Poeni llawer am fewnfudo
Dosbarth canol Dosbarth gweithiol
Byw mewn stadau o dai sengl preifat Byw mewn tai cyngor
Byw mewn ardaloedd dinas fewnol Byw mewn ardaloedd ôl-ddiwydiant

Yn lle holi a yw person o blaid gadael yr UE, gall ymholiad fynd ar drywydd diddordebau cysylltiedig. Gan ddefnyddio’r tabl blaenorol fel map, gallaf hybu cefnogaeth dros yr ymgyrch Gadael drwy ddangos hysbysebion “bydd gadael yr UE yn sicrhau mwy o bres i adnewyddu tai cyngor” neu “bydd gadael yr UE yn ein galluogi i adnewyddu hen weithfeydd mewn ardaloedd diwydiannol”.

I fynd ymhellach gallaf greu ffeithiau neu newyddion ffug i ategu’r neges mewn hysbyseb. Yn ogystal â dangos hysbyseb “bydd gadael yr UE yn sicrhau mwy o bres i adnewyddu tai cyngor”, bydd dolen at erthygl wneud ar sut mae’r UE yn cwtogi ar alluoedd awdurdodau lleol i adnewyddu eu tai cyngor oherwydd biwrocratiaeth. Bydd hyn yn targedu pobl sydd eisoes ar y trywydd o daro pleidlais dros adael yr UE. I’r rheiny sydd eto i wneud penderfyniad, gall newyddion ffug cael ei greu i bardduo rhai o nodweddion proffil Aros. Gyda hysbyseb “nid yw’r UE yn trin mewnfudwyr gyda thegwch” bydd dolen i erthygl ar sut mae’r llywodraeth gyfredol yn ceisio rhoi mwy o hawliau i fewnfudwyr, ond methu gan nad yw’n cyfateb a pholisi Brwsel.

Nid yw’r uchod yn wahanol i hen dactegau gwleidyddol o faeddu enw rhywun gyda smear campaign, ond mae llawer mwy effeithiol pan fo hysbysebu yn cael ei dargedu at unigolyn.

Technegau proffilio

Gall berson ysgrifennu “Brexit yw’r peth orau i ddigwydd i’r wlad ma!” neu “Brexit yw’r peth gwaethau i ddigwydd i’w wlad ma!”, a chymryd yn ganiataol bod y person o blaid Brexit oherwydd presenoldeb y gair.

Gyda thechnegau dysgu peiriant (machine learning), mae’n bosib hyfforddi cyfrifiadur i geisio adnabod teimladau sy’n wraidd i neges (sentiment analysis). Un o rhain yw dosbarthwr diniwed Bayes (naive Bayes classifier), sydd yn ddosbarthwr tebygoliaethol (probabilistic classifier). Mae dosbarthwr diniwed Bayes yn un dan oruchwyliaeth, gan ein bod yn bwydo data sydd wedi ei labelu un ai Aros neu Gadael. Yr ydym wedi penderfynu eisoes i ba grŵp mae’r neges yn perthyn, ac yr ydym am hyfforddi’r cyfrifiadur i geisio dysgu’r patrymau hyn.

Petai deg darn o destun, ac yn wybodus i ni mae pum neges o blaid Aros a phump o blaid Gadael, y tebygolrwydd o ddewis neges Aros ar hap yw 0.5 – y tebygolrwydd o ddewis Gadael yw 0.5. Mewn achos o gael deg neges a saith wedi ei labelu’n Aros, y tebygolrwydd o ddewis neges Aros ar hap yw 0.7 etc. Y cam nesaf yw cyfrifo amlder allweddeiriau o fewn negeseuon Aros a Gadael.

Yr yr enghraifft ddilynol, wedi dadansoddiad testun sydd yn cynnwys y gair “mewnfudwyr” y tebygolrwydd mai neges o blaid Aros yw 0.05 (0.5 x 0.01), tra fo’r tebygolrwydd mai neges o blaid Gadael yw 0.3 (0.5 x 0.6). Gall y broses hon gael ei ail-adrodd drosodd a throsodd gydag ystod eang o allweddeiriau.

 

Techneg wahanol yw word2vec, sydd yn ddosbarthwr heb oruchwyliaeth. Mae’n dibynnu ar dechnolegau rhwydwaith niwral (yr un math sydd yn gefn i geir hunan-yrru) ac yn rhifo geiriau o fewn darn o destun. Caiff y rhifau hyn eu gosod mewn gofod gyda sawl dimensiwn, a thrwy broses o brofi a gwella, mae’r dosbarthwr yn cyfrifo pa eiriau sydd fwyaf tebygol o amgylchynu un o dan sylw o fewn brawddeg, fel yn yr enghraifft ddilynol. Trwy weld pa eiriau sydd yn agos i’w gilydd gall Camrbidge Analytica gynnwys rhai newydd yn ran o broffil.

Hyd yn hyn mae’r ystyriaeth wedi bod yn chwilota negeseuon am allweddeiriau. Nid yw pawb yn rhannu negeseuon. Ond petaent yn hoffi neges cyfaill neu glicio ar ddolen, mae’n bosib ychwanegu’r testun at eu proffiliau nhw. Petai person A yn ysgrifennu neges, a phobl B a C yn hoffi’r neges, er nad yw B a C wedi ysgfriennu unrhyw beth bydd neges person A yn cael ei ychwanegu at broffiliau B a C. Mae medrau cyfrifiaduron heddiw yn ein galluogi i adeiladu proffiliau enfawr am bobl, a miliynau ohonynt.

 

Cyfoethogiad data a phroffilio manwl

Yr ydym wedi dechrau gydag egin o ddatwm, sef rhif adnabod cyfrif Facebook, ac wedi mynd ati i broffilio person drwy gasglu data a’i gysylltu yn ôl i’r egin. Mae’n bosib un ai astudio cysylltiadau uniongyrchol o fewn set o ddata e.e. negeseuon a ysgrifennwyd ar Facebook, negeseuon a hoffwyd ar Facebook, dolennau sydd wedi ei glicio, tudalennau sy’n cael eu dilyn, rhestr cyfeillion, manylion proffil fel dyddiad geni, neu edrych am ddata o darddau eraill.

Pan fydd data o sawl tardd yn cael ei roi yn yr un lle, mae’n bosib defnyddio algorithmau i’w cydweddu. Petai Cambridge Analytica wedi cael gafael ar lwyth o ddata o Facebook a Twitter, mae’n bosib bod yr un person yn bodoli yn y ddau set.

Gall algorithm fel pellter Levenshtein gymharu pa mor agos yw un darn o destun i ddarn o destun arall – petaech gyda dau gofnod sydd yn cynnwys maes enw, gellir rhoi sgôr ar y tebygrwydd mai’r un enw ydyw. Os oes sawl maes i’w gymharu fel enw, dyddiad geni, a chyfeiriad, mae wedyn yn bosib creu sgôr hyder i ddangos mesur o sicrwydd. Ar raddfa enfawr, mae meddalwedd menter gan gyflenwyr fel IBM yn ceisio cydweddu data o ffynonellau gwahanol – miliynau o bwyntiau data – mwy o wybodaeth yma.

O wybod hyn, does dim i beidio amau bod Cambridge Analytica wedi casglu data o Facebook, Twitter, Pinterest, Instagram ac unrhyw gyfrwng cymdeithasol arall, ei gydweddu a chreu proffiliau, gyda chysylltiadau mewnol wedi eu seilio ar hoffterau, aildrydariadau, nifer o weithiau a ddarllenwyd. Rhywbeth sydd yn sicr o roi braw i bobl pan fyddent yn sylweddoli cymaint o wybodaeth maent yn ei rannu.

Yn aml mae data o un tardd yn gallu bod yn ddiddorol, ond mae’r gwir werth yn dod o gyfuno sawl tardd efo’i gilydd. Dim ond wedyn mae’n bosib creu cysylltiadau rhwng pwyntiau data gwahanol a chyflwyno mewnwelediadau na fuodd yn amlwg ynghynt.

I gloi, ystyriwch beth sydd yn bosib gyda setiau o ddata sydd yn agored ac am ddim. Petaech yn cydweddu proffil Facebook neu Twitter gyda manylion sydd ar y Gofrestr Etholiadol neu’r Llyfr Ffôn, mae modd cysylltu cyfeiriad tŷ a rhif ffôn. Wedi gwneud hyn beth am gydweddu’r cyfeiriad o’r Gofrestr Etholiadol efo’i hun eto, a chysylltu enwau pobl eraill sydd yn rhannu’r un cyfeiriad – creu rhwydwaith o sut mae pobl yn gysylltiedig i’w gilydd. Mae llawer yn bosib eisoes, ac nid Cambridge Analytica yw’r unig rai sydd yn manteisio ar y data.

 

Posted in Uncategorized | Leave a comment

Map un-person un-smotyn

I’r rheiny sydd â diddordeb yn yr iaith Gymraeg, map digon cyffredin yw’r un coropleth isod. Mae’r nifer o bobl sydd â medrau yn y Gymraeg wedi eu grwpio i mewn i amrediadau, gyda lliw sydd yn tywyllhau wrth i’r nifer gynyddu. Daw’r data o Gyfrifiad 2011 (mwy o gefndir ar statiath.com), ac mae’r nifer sydd â medrau wedi eu cyhoeddi yn ôl LSOA (Lower Layer Super Output Area – allbwn haen isaf uwch ardal?). LSOA yw’r ardal ddaearyddol leiaf mae’r Swyddfa Ystadegau Gwladol yn ei ddefnyddio wrth gyhoeddi data manwl.

Coropleth o nifer o bobl sydd â medrau yn y Gymraeg. Ardaloedd llwyd yn dynodi ardaloedd ble nad oes data ar gael.

Un o anfanteision gwybodaeth y Cyfrifiad, er yn hollol ddealladwy, yw ei fod yn cuddio manylion ble gall unigolion cael eu hadnabod. Caiff gwybodaeth sy’n ein galluogi i adnabod unigolion ei gyhoeddi wedi traul gan mlynedd. Felly, yn ôl map coropleth gallem ond dehongli niferoedd ar raddfa uchel gyffredinol. Ond os ydym eisiau dehongli’r wybodaeth ar raddfa unigolion, un ymgais yw defnyddio map dosraniad smotyn neu ddwysedd dot, ble mae pob un smotyn yn cynrychioli person. Caiff y smotiau eu creu a’u gosod ar hap – o wybod bod 500 siaradwr Cymraeg yn yr ardal hon, creu 500 smotyn ar hap o fewn y ffiniau.

Map dosraniad dot o nifer o bobl sydd â medrau yn y Gymraeg. Nid oes data ar gyhoedd i rai ardaloedd megis Aberdaron ar Pen Llŷn.

Anfantais coropleth yw ei fod yn methu dangos niferoedd uwch siaradwyr Cymraeg yn ardal e.e. Caerdydd, oherwydd ffiniau LSAO. Ond mae map dosraniad smotyn yn dangos hyn – sylwch y siaradwyr Cymraeg mewn trefi, er bod coropleth yn ceisio dangos eu bod ar wasgar yn y cefn gwlad.

Daeth yr ysbrydoliaeth wedi sylw gan Hywel Jones ar bost Voronoi Cymru hyper-leol yn holi pam na wnes i ddefnyddio QGIS. Felly dyma mapiau wedi eu creu gyda QGIS, a chyfarwyddiadau yma ac yma.

Posted in Uncategorized | Leave a comment

Voronoi Cymru hyper-leol

Heb fynd i sôn am siom diffyg papur newydd dyddiol Y Byd, mae Cymru’n ffodus bod ganddi rwydwaith o bapurau bro; er bod y cynnwys yn tueddu i fod ar bapur yn unig (eithriad yma – Clonc). Ond beth petai gan y papurau bro hyn mwy o bresenoldeb ar-lein? Yn ôl yn 2015, yng nghanol cyffro gwefannau newyddion hyper-leol,  yr oedd Ifan Morgan Jones yn pendroni’r un syniad. Aeth ati i greu map i ddiffinio dalgylchoedd hyper-leol. O’r hyn sydd i’w weld, mae wedi ei seilio ar grwpiau o godau post. Dwi reit hoff o’r map, ac yr oeddwn am geisio creu’r map ond mewn dull gwahanol i lungopïo a gludo darnau o bapur.

Map hyper-leol Ifan Morgan Jones

Map Voronoi yn ceisio defnyddio’r un dalgylchoedd

Map Voronoi wedi ei seilio ar ranbarthau cod post – LL30, SA69 etc.

O’r nifer o setiau data agored sydd bellach ar gael, un o rain yw Code-Point Open gan yr OS. Gellir cael rhywfaint am ddim, ond petaech yn talu mae mwy o ddata defnyddiol i’w gael, sef pwyntiau ffiniau dalgylchoedd codau post. Yn y fersiwn sydd am ddim, mae pob cod post gyda lleoliad y canolbwynt – dim ffiniau dalgylch. Felly, gan ddefnyddio meddalwedd R es ati i gymryd lleoliadau codau post, eu grwpio yn ôl hanner cyntaf y cod, ac wedyn cyfrifo cyfesurynnau cyfartalog y pwyntiau. Mantais hyn yw bod y pwynt yn tueddu i gael ei ganoli ar ardaloedd ble mae llawer o strydoedd – mwy o bobl – yn lle ardal eang wag.

Ar ôl paratoi’r pwyntiau i bob cod post, sef y darn mwyaf poenus, fe wnes i ddefnyddio pecyn deldir yn R i greu diagram Voronoi. Un i bob un grŵp o godau post, ac un arall i’r codau post wedi eu grwpio fel rhai Ifan. Mae diagram Voronoi yn ceisio tynnu llinellau neu ffiniau yn union hanner ffordd rhwng dau bwynt fel arfer, gan arwain at greu dalgylchoedd. O’r hyn y gwelaf, mae diagram Voronoi yn debyg iawn i fap Ifan!

 

 

I wneud diagramau Voronoi eich hun, mae Flowing Data efo tiwtorial yma.

 

O.N. Be am uwch lwytho cynnwys papurau bro i un wefan, a’i archifio rywbryd?

Posted in Uncategorized | 3 Responses

Twristiaeth yn oes Brexit

Taking back control

Daeth papur academaidd Culture, identity and tourism representation: Marketing Cymru or Wales? (PDF, 200kb) gan Annette Pritchard a Nigel Morgan, i’m golwg wedi penderfyniad hurt Llywodraeth Cymru i adeiladu cylch haearn yn y Fflint. Yr oedd y cylch i gynrychioli Cylch cestyll Edward 1af yng ngogledd Cymru, fel rhan o ryw ddodrefnan i ddenu twristiaid. Wedi’r ymateb cynddeiriog gan y cyhoedd, fe gladdwyd y syniad. Am rŵan o leiaf; synnwn i ddim petai’n atgyfodi oherwydd ddifyg unrhyw arweinyddiaeth economaidd well.

Yn y papur, mae trafodaeth ar sut caiff Cymru ei marchnata ym maes twristiaeth, gyda nifer o enghreifftiau. Yn gryno, pan fo Cymru yn cael ei marchnata yn rhyngwladol, y tirlun, y bobl, yr iaith a’r diwylliant sy’n cael ei arddangos fel nodweddion o bwys. Pan fo Cymru’n cael ei marchnata o fewn y DU, mae’n osgoi sôn am unrhyw ddiwylliant, yr iaith neu unrhyw arferion y Cymry. Dim ond y tirlun sy’n cael ei arddangos a’i werthu. O’r bobl a ymchwiliwyd yn y papur, mae sawl un arddangos agwedd digon trahaus at y Cymry, cystal ag anffawd Cymru yw’r Cymry.

Cafodd y papur ei gyhoeddi yn 2000 ond hyd yn oed eleni, prif nodweddion marchnata Croeso Cymru yw antur, Epic, a gweithgareddau awyr agored (gweler Zip World, Surf Snowdonia, Bounce Below [dim enwau Cymraeg yma diolch]). Os caf fod yn ddifrïol, troi fy nghartref yn “leisure opportunity” i bobl eraill. O’r hyn y gallaf ei weld a’i brofi, y flaenoriaeth, neu bosib yr unig strategaeth sydd gan Lywodraeth Cymru yw datblygu diwydiant twristiaeth ar draul unrhyw ddiwydiant arall.

Ysywaeth, tra bod Llywodraeth Cymru llarïaidd yn mynd yn ei flaen gydag Epic, mae Brexit. Os/pan fydd y DU yn gwahanu o’r Undeb Ewropeaidd, bydd yr Almaen, y wlad fwyaf a’r un sydd mwyaf pwerus eisoes, yn fwy fyth. Prif farchnadoedd twristiaid i Gymru yw’r UDA, yr Almaen, yr Iseldiroedd ac Awstralia. Eisoes mae gwerth cymharol y Bunt yn is, sydd yn gwneud Cymru yn le mwy fforddiadwy i’w hymweld, ac yn gyfleus i drigolion yr Almaen a’r Iseldiroedd.

Anffawd Cymru yw ei bod yn rhannu gwladwriaeth gyda Lloegr sydd am fod yn Brydain. Does dim yn dieithrio Cymru rhag bod yn rhan o Brydain cydlynol yn fwy na’r Gymraeg – yr “arall” – sy’n gadael i Loegr a Chymru creu cyferbyniad – y nhw a ni. (Gweler llyfr Simon Brooks, Pam na fu Cymru?) Caiff Gwyn Alf Williams ei ddyfynnu “A country called Wales exists only because the Welsh invented it. The Welsh exists only because they invented themselves.” Y Cymry, cymaint â’r Saeson yn gyfrifol am greu’r cyferbyniad, ac o gymorth yn diffinio’r ddwy wlad. Er dyfynnu barnau sydd yn siŵr yn ddigon adnabyddus i’r Cymry fel “something primitive and contemptible and best forgotten”, mae nifer o’r daliadau hyn yn parhau i ryw raddau hyd heddiw.

Gyda digwyddiad dirdynnol Brexit, mae wedi gwneud i nifer fod yn fwy cyfforddus ac agored am eu daliadau anghynnes. Dyfyniad arall o’r papur “… for these consumers, the Welsh language encapsulates Welsh patriotism and nationalism and WTB [Wales Tourist Board] research confirms that some English people are uncomfortable with the existence of a different (and thriving) language and heritage in their midst. For them another language excludes and engenders uncomfortable notions of foreignness”. Dyma agwedd sy’n crynhoi’r DU heddiw yn oes Brexit.

Gan fod twristiaeth yn gyfran fawr o fasnach ryngwladol, ni ddylid ei ddiystyru, ond dylid newid sut caiff ei gyflawni. Dylai Croeso Cymru a Llywodraeth Cymru newid eu strategaeth i ddifa’r gwahaniaethu mewn marchnata rhwng cynulleidfaoedd domestig a rhyngwladol. Trwy wahaniaethu, a dileu unrhyw sôn am Gymry yng Nghymru, maent yn atgyfnerthu’r agwedd sydd wedi ei ddyfynnu uchod. Pan ddigwyddodd refferendwm Brexit, daeth pobl i ddeall ei fod oll am elyniaethu pobl nad ydynt yn Seisnig. Trwy farchnata Cymru heb sôn am yr iaith, ei phobl na’i diwylliant, mae pobl yn dod i ddeall fod Cymru heb y Cymry.

Dylai twristiaeth fod er lles y Cymry, nid i’w difa o’r dirwedd.

Posted in Uncategorized | 1 Response

Mapio defnyddwyr Strava

Digwyddiadau Strava yng Nghaernarfon.

Yn aml y byddaf yn defnyddio app Strava ar fy ffôn symudol, sy’n fy ngalluogi i gofnodi, ble dwi’n rhedeg neu feicio, pa mor bell y byddaf yn mynd, a fy nghyflymder. Mae’n enghraifft arall o wasanaeth cyfrwng cymdeithasol, sy’n rhoi llwyfan i mi, a nifer o bobl eraill, rannu ein gweithgareddau, gan hefyd ychwanegu elfen gystadleuol e.e. gweld pwy sy’n gynt na chi ar ddarn penodol o ffordd &c. Er hyn, dwi’n gyndyn i rannu pob peth gan nad ydw i am i bawb wybod be dwi’n ei wneud nac ym mhle; yn defnyddio Strava i gofnodi fy nghyflymder &c ond ddim yn ei rannu efo’r Byd. Yn fwy penodol dwi’n mynd allan ar fy meic neu i redeg i ddianc rhag pawb a phopeth, ac i wacáu fy meddwl.

Gyda’r data sydd yn cael ei rannu’n gyhoeddus, mae Strava wedi bod wrthi yn ei brosesu ac wedi ei arddangos ar ffurf gwresfap. Maent yn sôn am yr anawsterau o weithio gyda symiau enfawr o ddata ar eu blog peiriannu, ond mae’r map rhyngweithiol i’w weld yma.

 

Posted in Uncategorized | Leave a comment

Dadansoddi damweiniau A55

Yn ddyddiol mae papur newydd Daily Post efo erthygl ynghylch y brif ffordd A55. Bydd unrhyw drafferth ar y ffordd yn gyfuniad o waith ffordd, pobl hurt, ac, yn fy marn i, gorddefnydd o’r ffordd (twristiaid a pherchnogion tai haf yn gwneud teithiau hir bob penwythnos). Digwyddiad sy’n siŵr o arafu llif y traffig yw damwain. Felly, gwnaethais gais rhyddid gwybodaeth trwy wefan WhatDoTheyKnow am y niferoedd o ddamweiniau a phryd y’i digwyddodd. Wedi tipyn o aros ces i’r data, ac yr wyf wedi mynd ati i ddadansoddi rhai o’r rhifau. Amrediad y data yw Ionawr 2005 hyd ddiwedd Rhagfyr 2015, ond mae Llywodraeth Cymru‘n dweud y byddent yn cyhoeddi data hyd at 2016 am Gymru gyfan (dwi’n meddwl), ymhen dipyn.

Fe wnes i’r dadansoddi gyda Python ar y cyfan, efo dipyn o arbrofi yn Excel a R.

Gydag unrhyw ddadansoddiad a delweddu, mae dau brif fwriad. Adrodd stori gan ddefnyddio delweddau fel cefnogaeth, neu ddefnyddio delweddau i geisio adnabod a darganfod patrymau. Gall un tardd o wybodaeth ddangos dipyn, ond trwy gyfuno nifer efo’i gilydd, fel tywydd a digwyddiadau bydol, mae darlun mwy cyflawn yn gallu cael ei roi. Am rŵan, dim ond un set data sydd yma.

 

A yw pethau’n gwaethygu?

Casglu’r nifer o ddamweiniau yn ôl diwrnod yr wythnos a blwyddyn, a’i roi mewn siartiau bar. Sul yw’r diwrnod mwyaf distaw, tra bod tueddiad i’r niferoedd o ddamweiniau leihau dros y blynyddoedd! Siart bar yw hwn, ond gan fod pob damwain yn ymddangos fel rhes, gall fod yn histogram yn ogystal.

 

Pryd i osgoi’r A55

Nifer o ddamweiniau yn ôl diwrnod yr wythnos ac amser y dydd. O leiaf rŵan mae’n bosib gweld yr amser orau i beidio teithio ar A55 – nos Wener yn un amlwg, ond hefyd rhwng 17:00 a 18:00 ar nos Lun. Yn wreiddiol, fe wnes i grynhoi’r niferoedd bob yn dair awr, ond trwy wneud hynny yr ydych yn colli’r manylion e.e. nos Lun.

 

Ble i osgoi’r A55

I geisio canfod y mannau mwyaf peryglus, fe wnes i ddefnyddio algorithm clystyru DBScan, sydd yn fath o ddeallusrwydd artiffisial – dysgu peiriant heb oruchwyliaeth (unsupervised machine learning). Algorithm clystyru poblogaidd yw K-means, ond oherwydd gwerthoedd hydred a lledred, mae K-means yn gallu gwyro data gofodol, felly mae DBScan yn fwy addas. I adeiladu’r clystyrau, mae dau amod. Y nifer o bwyntiau sydd ei hangen i glwstwr fodoli, a’r pellter rhwng pwyntiau er mwyn iddi fod yn rhan o’r clwstwr. Gyda thipyn o arbrofi, fe wnes i osod clwstwr gyda lleiafrif o 40 pwynt data, a bod pob pwynt o fewn milltir o’i gilydd. Gan ddefnyddio’r amodau hyn, fe ffurfiwyd pedwar clwstwr, sydd isod.

O weld y mapiau, cadarnhau eich disgwyliadau. O’r top chwith: Pont Britannia, ble mae dau lon yn mynd i un a chyfyngiadau cyflymder; twneli Conwy, ble mae cornel, angen arafu, a newid o olau dydd i dywyllwch; ger Pentre Helygain ble yn aml geir niwl, cyffyrdd bach, a phobl yn ceisio cyflymu ar ôl dringo allt; ger Ewlo a Bwcle ble mae cyfnewid rhwng ffyrdd A55 ac A494, newid lonydd, troad cul.

Gall llawer mwy o ddadansoddi gael ei wneud, fel cyfres amser, a chymharu dyddiau o’r flwyddyn – ffyrdd distewach ar ddiwrnod Nadoli – ond mae’n hyn yn ddigon am rwan.

 

Map rhyngweithiol

Petaech eisiau gweld yr holl ddata wedi ei roi ar fap, heb y dadansoddi clwstwr, cliciwch yma.

 

(Er gwybodaeth, mae clystyru gyda dysgu peiriant yn cael ei ddefnyddio am nifer o bethau; un ohonynt yn dwyll ariannol. Petai eich ymddygiad prynu, fel ble yr ydych yn siopa, neu faint yr ydych yn ei wario yn cael eu gosod fel pwyntiau, yna mae’n bosib eu clystyru i gyfleu ymddygiad ‘normal’. Os yw pwynt ddim yn rhan o’r clwstwr, gall fod yn bryniad na fuasech yn ei wneud fel arfer, neu wlad nad ydych yn ei ymweld fel arfer.)

Posted in Uncategorized | Leave a comment

Cymru × Monocle

Yn rhifyn pump o The Forecast gan gylchgrawn Monocle, mae Arolwg Cenedl am Gymru, sydd wedi derbyn nawdd gan Fwrdd Twristiaeth Cymru.

Fel nad yw rhywbeth fel hyn yn cael ei fethu, dyma cipolwg o’i gynnwys. Mae’n werth ei weld, gan ei fod yn derbyn triniaeth ‘glan’ Monocle.

Caiff Cymru ei ddisgrifio fel gwlad o harddwch naturiol eithriadol sydd yn brysur troi yn un o gorneli mwyaf byrlymus yn Ewrop. Bob yn ail dudalen mae llun trawiadol o Gymru, fel isod, sy’n deillio o ymgyrch ‘Epic’. (Gwell i mi beidio dweud dim…)

 

Mewn rhagair gan Brif Weinidog Cymru, Carwyn Jones, mae’n crybwyll Haf 2016 fel un o deimladau cymysg – penderfyniad i adael yr Undeb Ewropeaidd, a lled-lwyddiant tîm pêl-droed Cymru ym Mhencampwriaeth Ewrop. Mae’n mynd ati i ddisgrifio Caerdydd fel un o ddinasoedd y DU sy’n tyfu cyflymaf, ac yn ffynnu ym maes diwydiannau creadigol. I bwysleisio safon yr hyn sydd gan Gymru i’w gynnig, mae’n nodi Aston Martin, Airbus, Melin Tregwynt a Hiut Denim fel enwau o fri. I gloi, mae’n cyffwrdd ar daith datganoli cyffroes Cymru ers 1999, a bod dyfodol disglair o’n blaenau.

Mae sawl pennod gan gynnwys Caerdydd, Isadeiledd, Bwyd a diod, Natur a’r amgylchedd, a Busnes ac economi. Y bennod olaf yw Pethau y byddem yn ei brynu, sef llun o nwyddau sydd, yn eu tyb, yn cynrychioli Cymru orau. Mae rhestr o’r nwyddau isod, ond sylwer nad oes dim o draidd technoleg neu ddiwydiant yn anffodus.

Posted in Uncategorized | Leave a comment

Cymry ar blât

Ddoe, es i am goffi i Scandi Kitchen yn ardal Fitzrovia o Lundain. Yr ydywf wedi bod yno o’r blaen, mwy nag unwaith, a hynny ynghylch y sylw a dena’r Smörgåsbordiau (dwi’n meddwl na’r didolnod a’r Angstrom sydd yn haeddu’r sylw). Y tro hyn sylwais ar nodwedd bach ar eu bwydlenni. Gweler y llun isod sy’n dangos y nodwedd – yr ochr chwith – sy’n cynnwys y ddwy ochr er gwybodaeth (clic am fersiwn mwy).

Bwydlen sy’n peri i chi dreulio mwy o amser nag arfer yn ei ddarllen. Beth am wneud un am gymeriad hanesyddol Cymreig?

Dyma ymgais fras gennyf i siop goffi Providero yr ydwyf yn mynychu yng Nghyffordd Llandudno (Tremarl), ynghylch Kate Roberts. Rhaid nodi nad yw hyn wedi derbyn caniatâd, ond bosib yn gwneith sbarduno rhywbeth.,.

 

Dwi i’w weld yn astudio bwydlenni (neu’n gwario gormod o bres ar goffi drud) mwy na’r disgwyl, felly mae’r syniad uchod yn werth gwneud. I rai yn Llundain, nid yw Cymru wedi cyrraedd 1996. Dyfed? (Rhan o fwydlen MILK yn Balham, Llundain. Gwerth ymweld â’r wefan retro!)

Posted in Uncategorized | Leave a comment

Pleserau anhysbys R

 

Iaith sgriptio sy’n cael ei ddefnyddio gan fathemategwyr ac ystadegwyr yw R. Mae’n becyn defnyddiol iawn i brototeipio modelau ystadegol, ac y mae ganddi gefnogaeth dda i ddelweddu gwybodaeth ofodol a chreu mapiau. Un math o fap posib yw choropleth, sy’n cael ei ddangos yn dda gan Siôn Gwilym yma (rhagolwg isod – does gen i ddim syniad os yw wedi defnyddiodd R neu beidio, ond dyma’r hyn sydd i’w ddisgwyl).

Iaith sgriptio arall, ond un sydd bosib yn fwy poblogaidd erbyn hyn yw Python. Mae Python yn ddefnyddiol i wneud pob math o dasgau ailadroddus, ac yn syml, sef dileu cromfachau mewn 1000 ffeil mewn ffolder ar unwaith, trin gwybodaeth yn fathemategol, a graffio gwybodaeth. Ond mae’n ddigon pwerus i reoli synhwyrau electronig e.e. cofnodi tymheredd dros amser. Mantais Python yw bod cymuned fawr oddi amgylch hi, sy’n golygu bod mwy o bobl yn cynnig nodweddion newydd ac yn cyhoeddi gwelliannau cyffredinol. Er bod Python mymryn ar y blaen, tydi hi ddim o bell ffordd wedi curo R.

Yn dibynnu ar yr hyn yr ydych yn ceisio’i gyflawni, mae gan Python a R ei fanteision ac anfanteision. Felly, yn aml caiff y ddwy iaith sgriptio ei ddefnyddio ar y cyd.

Daw bôn y syniad yn y llun isod gan waith James Cheshire, sydd yn ddarlithydd mewn cartograffeg a gwybodaeth ofodol yn UCL, ac sydd yn aml yn cyhoeddi ei waith fel yn yr achos hwn. Mae’n cyfeirio at ddulliau gan ddau berson arall sy’n creu’r un effaith – oll yn rhannu eu cod. Ym mhob achos maent yn dibynnu ar ddata o’r byd cyfan gan y Cenhedloedd Unedig, sydd wedi ei drawsnewid i mewn i rid yn barod. H.y. pwyntiau o ddata wedi eu gwahanu i mewn i sgwariau cyson. Y broblem gyda phrosesu set o ddata mawr ar gyfrifiadur cyffredin yw eich bod angen lot o gof (RAM) a lle disg – anghenion sydd yn fwy na chyfrifiadur personol. (Mae’r data ei hun yn dibynnu ar amcangyfrifon poblogaeth yn seiliedig ar rid 1 km sgwâr.)

I osgoi’r broblem o ddiffyg adnoddau cyfrifiadurol, lawrlwythais gwybodaeth Cyfrifiad 2011, sydd yn rhoi’r nifer o bobl breswyl ym mhob cod post ar noson y cyfrifiad. Yn ogystal â hyn lawrlwythais wybodaeth Arolwg Ordnans (OS) Code-Point Open, sydd yn cynnwys data ar god post a hefyd manylion gogleddiad a dwyreiniad y canolbwynt. Mae llawer o wybodaeth yr Arolwg Ordnans o dan drwydded. Hefyd, mae’r system cod post gan y Post Brenhinol o dan hawlfraint, felly mae’n bosib cael mwy o wybodaeth ond ar yr amod eich bod yn talu!

Yn aml, yr ydym yn ystyried y Ddaear fel sffêr perffaith, ond tydi hi ddim, ac mae angen tafluniad daearyddol – newid o bwyntiau tri-dimensiwn y Ddaear i ddau-dimensiwn fflat i ddangos ar bapur. Mae trosi o un tafluniad daearyddol i un arall, sef gogleddiad a dwyreiniad i hydred a lledred, yn beth gymhleth. Nid yw crymedd y Ddaear yn yr Alban yr un fath yng Nghymru! I drosi o ogleddiad a dwyreiniad i hydred a lledred, mae angen gwybod beth yw’r hafaliadau sy’n berthnasol i ran o’r Ddaear sy’n cynnwys Ynysoedd Prydain, a gwneud lot o waith trigonometreg. Yr oeddwn yn rhy ddiog i fentro ar hyn, felly wnes i ddefnyddio gwasanaeth Google Maps API. Drwy ddefnyddio pecyn Python GeoPy, mae’n bosib anfon cod post i Google Maps, a chael cyfeiriad, hydred a lledred yn ôl. Felly cychwynnais drwy ail-adrodd y broses hon drwy ffeil llawn codau post sy’n ymwneud a Chymru. Fel llawer o wasanaethau API mae terfyn ar faint o wybodaeth a chewch yn ôl. Yn achos Google Maps, 2500 pob 24 awr yw hi – mae gan Gymru fyny at 100,000 o godau post; digon o amser i ffoi i’r anialwch am gyfnod (40 diwrnod)!

Wrth i’r data hydred a lledred cael ei gasglu’n araf, ceisiais wneud plot miniog, fel un James Cheshire, o Gymru, ond mae’r pwyntiau wedi eu gwasgaru’n anhrefnus. I greu’r plot, mae angen gwybodaeth ar ffurf grid. Un ffordd o wneud hyn gyda’r data’r oeddwn wedi ei gasglu oedd trwy ryngosodiad – sef amcangyfrif poblogaeth mewn un pwynt, o wybod y boblogaeth mewn pwysiau eraill cyfagos. Un math o fodel rhyngosod yw Krige, sef dull ystadegol a ddatblygwyd gan Danie Krige yn Ne Affrica i amcangyfrif dwysedd mwyn aur yn y tir.

I ddangos enghraifft o ryngosod Krige, dyma dri phlot o boblogaeth y Bala, gyda gridiau o faint gwahanol.

Buasai gwneud hyn dros Gymru gyfan wedi cymryd oriau i ddyddiau. Am bob pwynt ychwanegol, mae rhyngosod Krige yn ail-gyfrifo’r gwerth i bob un cyfagos. I geisio lleihau’r amser prosesu, fe wnes i wnes i dalu am weinydd Elastic Compute 2 (EC2) ar Amazon Web Services a rhagosod R Studio Server, i gael mynediad at fwy o adnoddau, ond yr oedd hyn am fod yn rhy ddrud.

Felly es i’n ôl at y data yr oeddwn efo’n barod a cheisio trosi o ogleddiad a dwyreiniad i hydred a lledred. Cychwynnais ar geisio ysgrifennu’r hafaliadau angenrheidiol, cyn gwneud mwy o graffu ar y we am god wedi ei ysgrifennu gan rywun arall. Mae pecyn Python UTM ar gael, ond tydi o ddim i’w weld yn gweithio’n iawn. Yn ddigon lwcus i mi, mae Hannah Fry wedi casglu cod i wneud y trosi, ac mewn sawl iaith, gan gynnwys Python!

Felly yn Python, rhedeg ffwythiant i drosi gogleddiad/dwyreiniad i hydred/lledred i bob cod post yng Nghymru, wedyn defnyddio pecyn Pandas i uno cynnwys y ffeil gyda’r cyfesurynnau gyda ffeil arall sydd efo poblogaeth pob cod post. Wedyn mewnbynnu’r data i mewn i R gan ddefnyddio’r cod yn fan hyn gan Ryan Brideau gan newid un neu ddau o nodweddion. I gloi, gwneud dipyn o dacluso mewn Photoshop. Oherwydd adnabyddiad o ddiffyg adnoddau cyfrifiaduron, mae cod Ryan Brideau yn defnyddio pecyn sy’n cymryd mantais o brosesu paralel. Yn y mwyafrif o gyfrifiaduron y dyddiau hyn, mae sawl prosesydd. Os nad yw meddalwedd wedi ei ddylunio’n iawn, bydd ond yn defnyddio un prosesydd ar y tro yn lle e.e. pedwar, gan gymryd pedair gwaith yn hwy.

Felly dyma ail-greu map James Cheshire o Gymru, gydag addasiad bach i god Ryan Bridau i greu map o Gymru ar ffurf celf clawr albwm Joy Division, Unknown Pleasures. Mae’r map yn dangos poblogaeth gymarebol a dwysedd. Yn ddiddorol, mae’n bosib adnabod tirlun Cymru yn ôl y llefydd mae pobl yn trigo, heb ddangos unrhyw ffiniau.

Posted in Uncategorized | Leave a comment