Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Intelligent Automati...arrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
Intelligent Automation & Soft Computing
Article
License: CC BY
Data sources: UnpayWall
image/svg+xml Jakob Voss, based on art designer at PLoS, modified by Wikipedia users Nina and Beao Closed Access logo, derived from PLoS Open Access logo. This version with transparent background. http://commons.wikimedia.org/wiki/File:Closed_Access_logo_transparent.svg Jakob Voss, based on art designer at PLoS, modified by Wikipedia users Nina and Beao
https://dx.doi.org/10.60692/rq...
Other literature type . 2022
Data sources: Datacite
https://dx.doi.org/10.60692/f9...
Other literature type . 2022
Data sources: Datacite
versions View all 3 versions
addClaim

This Research product is the result of merged Research products in OpenAIRE.

You have already added 0 works in your ORCID record related to the merged Research product.

Ontology-Based Semantic Search Framework for Disparate Datasets

إطار البحث الدلالي القائم على الأنطولوجيا لمجموعات البيانات المتباينة
Authors: Paramjeet Kaur; Parma Nand; Salman Naseer; Akber Abid Gardezi; Fawaz Alassery; Habib Hamam; Omar Cheikhrouhou; +1 Authors

Ontology-Based Semantic Search Framework for Disparate Datasets

Abstract

Le secteur public fournit des données ouvertes pour créer de nouvelles opportunités, stimuler l'innovation et mettre en œuvre de nouvelles solutions qui profitent au monde universitaire et à la société. Cependant, les données ouvertes sont généralement disponibles en grande quantité et manquent souvent de qualité, de précision et d'exhaustivité. Il peut être difficile de trouver les bonnes données pour analyser une cible. Il existe de nombreux référentiels de données ouvertes riches, mais ils sont difficiles à comprendre et à utiliser car ces données ne peuvent être utilisées qu'avec un ensemble complexe d'options de recherche par mot clé, et même alors, Des données non pertinentes ou insuffisantes peuvent éventuellement être récupérées. Pour remédier à cette situation, la recherche sémantique basée sur l'ontologie s'est avérée être un moyen efficace d'améliorer la qualité des requêtes de contenu connexes dans ces référentiels. Dans cet article, nous proposons une nouvelle méthode de liaison sémantique et de stockage d'ensembles de données gouvernementaux ouverts des secteurs de l'agriculture, des terres et des précipitations de la Nouvelle-Zélande, basée sur l'utilisation de l'ontologie. L'ontologie générée peut construire des données intégrées, dans lesquelles une requête unifiée peut être appliquée pour extraire des informations plus riches et plus utiles. Pour valider notre modèle, nous avons montré comment ontologie de lien manuellement et automatiquement. La liaison manuelle nécessite des experts de domaine, et la liaison automatique réduit le surcoût de s'appuyer sur des experts de domaine pour lier manuellement des concepts. Les résultats de cette méthode sont prometteurs en termes d'amélioration de la qualité des données et de l'efficacité de la recherche. À l'avenir, le modèle proposé peut être intégré à d'autres ontologies de domaine.

El sector público proporciona datos abiertos para crear nuevas oportunidades, estimular la innovación e implementar nuevas soluciones que beneficien a la academia y la sociedad. Sin embargo, los datos abiertos generalmente están disponibles en grandes cantidades y, a menudo, carecen de calidad, precisión e integridad. Puede ser difícil encontrar los datos correctos para analizar un objetivo. Hay muchos repositorios de datos abiertos ricos, pero son difíciles de entender y usar porque estos datos solo se pueden usar con un conjunto complejo de opciones de búsqueda de palabras clave, e incluso entonces, datos irrelevantes o insuficientes pueden eventualmente recuperarse. Para aliviar esta situación, se ha demostrado que la búsqueda semántica basada en ontologías es una forma efectiva de mejorar la calidad de las consultas de contenido relacionado en dichos repositorios. En este documento, proponemos un nuevo método de vinculación semántica y almacenamiento de conjuntos de datos gubernamentales abiertos de los sectores de agricultura, tierras y precipitaciones de Nueva Zelanda basados en el uso de la ontología. La ontología generada puede construir datos integrados, en los que se puede aplicar una consulta unificada para extraer información más rica y útil. Para validar nuestro modelo, mostramos cómo enlace ontológico manual y automáticamente. El enlace manual requiere expertos en el dominio, y el enlace automático reduce la sobrecarga de depender de expertos en el dominio para vincular conceptos manualmente. Los resultados de este método son prometedores en términos de mejorar la calidad de los datos y la eficiencia de la búsqueda. En el futuro, el modelo propuesto se puede integrar con otras ontologías de dominio.

The public sector provides open data to create new opportunities, stimulate innovation, and implement new solutions that benefit academia and society.However, open data is usually available in large quantities and often lacks quality, accuracy, and completeness.It may be difficult to find the right data to analyze a target.There are many rich open data repositories, but they are difficult to understand and use because these data can only be used with a complex set of keyword search options, and even then, irrelevant or insufficient data may eventually be retrieved.To alleviate this situation, ontology-based semantic search has been proven to be an effective way to improve the quality of related content queries in such repositories.In this paper, we propose a new method of semantic linking and storing open government datasets of New Zealand's agriculture, land and rainfall sectors based on the use of ontology.The generated ontology can construct integrated data, in which a unified query can be applied to extract richer and more useful information.To validate our model, we showed how to link ontology manually and automatically.Manual linking requires domain experts, and automatic linking reduces the overhead of relying on domain experts to manually link concepts.The results of this method are promising in terms of improving data quality and search efficiency.In future, the proposed model can be integrated with other domain ontologies.

يوفر القطاع العام البيانات المفتوحة لخلق فرص جديدة، وتحفيز الابتكار، وتنفيذ حلول جديدة تفيد الأوساط الأكاديمية والمجتمع. ومع ذلك، عادة ما تكون البيانات المفتوحة متاحة بكميات كبيرة وغالبًا ما تفتقر إلى الجودة والدقة والاكتمال. قد يكون من الصعب العثور على البيانات الصحيحة لتحليل الهدف. هناك العديد من مستودعات البيانات المفتوحة الغنية، ولكن من الصعب فهمها واستخدامها لأنه لا يمكن استخدام هذه البيانات إلا مع مجموعة معقدة من خيارات البحث عن الكلمات الرئيسية، وحتى ذلك الحين، قد يتم في نهاية المطاف استرداد بيانات غير ذات صلة أو غير كافية. للتخفيف من هذا الوضع، ثبت أن البحث الدلالي القائم على الأنطولوجيا هو وسيلة فعالة لتحسين جودة استعلامات المحتوى ذات الصلة في مثل هذه المستودعات. في هذه الورقة، نقترح طريقة جديدة لربط وتخزين مجموعات البيانات الحكومية المفتوحة لقطاعات الزراعة والأراضي والأمطار في نيوزيلندا بناءً على استخدام الأنطولوجيا. يمكن للأنطولوجيا المتولدة بناء بيانات متكاملة، حيث يمكن تطبيق استعلام موحد لاستخراج معلومات أكثر ثراءً وفائدة. للتحقق من صحة نموذجنا، أظهرنا كيفية ربط الأنطولوجيا يدويًا وتلقائيًا. يتطلب الربط اليدوي خبراء المجال، والربط التلقائي يقلل من النفقات العامة للاعتماد على خبراء المجال لربط المفاهيم يدويًا. نتائج هذه الطريقة واعدة من حيث تحسين جودة البيانات وكفاءة البحث. في المستقبل، يمكن دمج النموذج المقترح مع أنطولوجيات المجال الأخرى.

Keywords

Data Quality Assessment and Improvement, Metric (unit), Economics, Construct (python library), Social Sciences, Business, Management and Accounting, Set (abstract data type), Epistemology, Management Science and Operations Research, Knowledge Representation, Mathematical analysis, Decision Sciences, Management Information Systems, Data science, Artificial Intelligence, Data Cleaning, FOS: Mathematics, Information retrieval, Data mining, Semantic Web, Domain (mathematical analysis), Ontology, Linked data, Data quality, Computer science, Ontology-based data integration, FOS: Philosophy, ethics and religion, Programming language, Completeness (order theory), Philosophy, Operations management, Linked Data, Computer Science, Physical Sciences, Quality (philosophy), Semantic Web and Ontology Development, Impact of Big Data Analytics on Business Performance, Mathematics

  • BIP!
    Impact byBIP!
    citations
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    3
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Top 10%
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
citations
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
3
Top 10%
Average
Average
hybrid