Belge özetlemeyi kullanma

Belge özetlemesi, kullanıcıların okumak için çok uzun süre düşünebilecekleri içeriği kısaltmak için tasarlanmıştır. Hem ayıklayıcı hem de soyutlayıcı özetleme, önemli cümlelere kadar makaleleri, makaleleri veya belgeleri daraltır.

Ayıklayıcı özetleme: Özgün içerik içindeki en önemli veya ilgili bilgileri topluca temsil eden cümleleri ayıklayarak bir özet oluşturur.

Soyut özetleme: Belgeden ana fikri yakalayan özet cümleler oluşturarak bir özet oluşturur.

Sorgu odaklı özetleme: Özetlerken sorgu kullanmanıza olanak tanır.

Bu özelliklerin her biri, belirtildiğinde belirli ilgi çekici öğeler etrafında özetlenebilir.

API tarafından kullanılan yapay zeka modelleri hizmet tarafından sağlanır, yalnızca analiz için içerik göndermeniz gerekir.

Daha kolay gezinmek için, her hizmet için ilgili bölümlerin bağlantıları aşağıdadır:

Görünüş Section
Ayıklayıcı Ayıklayıcı Özetleme
Soyutlayıcı Abstrctive Summarization
Sorgu odaklı Sorgu Odaklı Özetleme

Özellikler

İpucu

Bu özellikleri kullanmaya başlamak istiyorsanız, başlamak için hızlı başlangıç makalesini izleyebilirsiniz. Kod yazmaya gerek kalmadan Language Studio kullanarak da örnek isteklerde bulunabilirsiniz.

Ayıklayıcı özetleme API'sinde yapılandırılmamış bir metin belgesindeki temel cümleleri bulmak için doğal dil işleme teknikleri kullanılır. Bu cümleler belgenin ana fikrini topluca ifade eder.

Ayıklayıcı özetleme, sistem yanıtının bir parçası olarak, ayıklanan tümceler ve bunların özgün belgelerdeki konumları olarak bir derece puanı döndürür. Derece puanı, bir cümlenin belgenin ana fikriyle ne kadar ilgili olduğunu gösteren bir göstergedir. Model her cümleye 0 ile 1 (dahil) arasında bir puan verir ve istek başına en yüksek puanlı cümleleri döndürür. Örneğin, üç cümlelik bir özet isterseniz, hizmet en yüksek puanlı üç cümleyi döndürür.

Azure AI Dili'nde anahtar ifade ayıklama özelliği olan ve anahtar bilgileri ayıklayan başka bir özellik vardır. Anahtar tümcecik ayıklama ve ayıklayıcı özetleme arasında karar verirken aşağıdakileri göz önünde bulundurun:

  • Anahtar ifade ayıklama tümcecikleri döndürürken, ayıklayıcı özetleme tümceleri döndürür.
  • Ayıklayıcı özetleme, tümceleri bir derece puanıyla birlikte döndürür ve istek başına en yüksek dereceli cümleler döndürülür.
  • Ayıklayıcı özetleme aşağıdaki konum bilgilerini de döndürür:
    • Uzaklık: Ayıklanan her cümlenin başlangıç konumu.
    • Uzunluk: Ayıklanan her cümlenin uzunluğu.

Verilerin nasıl işleneceğini belirleme (isteğe bağlı)

Veri gönderme

Belgeleri API'ye metin dizesi olarak gönderirsiniz. İstek alındığında analiz gerçekleştirilir. API zaman uyumsuz olduğundan, API isteği gönderme ve sonuçları alma arasında bir gecikme olabilir.

Bu özelliği kullandığınızda API sonuçları, isteğin alındığı zamandan itibaren 24 saat boyunca kullanılabilir ve yanıtta belirtilir. Bu zaman aralığından sonra sonuçlar temizlenir ve artık alınamayacaktır.

Belge özetleme sonuçlarını alma

Dil algılamadan sonuç aldığınızda, sonuçları bir uygulamaya akışla aktarabilir veya çıkışı yerel sistemdeki bir dosyaya kaydedebilirsiniz.

Aşağıda özetleme için gönderebileceğiniz ve Tümleştirici yapay zekaya yönelik bütünsel bir gösterim başlıklı Microsoft blog makalesi kullanılarak ayıklanan bir içerik örneği verilmiştir. Bu makale yalnızca bir örnektir; API daha uzun giriş metni kabul edebilir. Daha fazla bilgi için veri sınırları bölümüne bakın.

"Microsoft olarak, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimseyerek yapay zekayı mevcut tekniklerin ötesine geçirme arayışındayız. Azure yapay zeka hizmetlerinin Baş Teknoloji Sorumlusu olarak, bu görevi gerçeğe dönüştürmek için harika bilim adamları ve mühendislerden oluşan bir ekiple birlikte çalışıyorum. Rolümde, insan bilişselliğin üç özniteliği arasındaki ilişkiyi görüntülemede benzersiz bir perspektiften keyif alıyorum: monolingual metin (X), sesli veya görsel duyusal sinyaller, (Y) ve çok dilli (Z). Üçünün de kesişiminde, Şekil 1'de gösterildiği gibi XYZ-code olarak adlandırdığımız sihir, insanları daha iyi konuşabilen, duyabilen, görebilen ve anlayan daha güçlü yapay zeka oluşturmaya ilişkin bir ortak gösterimdir. XYZ-code'un uzun vadeli vizyonumuzu yerine getirmemize olanak sağladığına inanıyoruz: etki alanları arası aktarım öğrenmesi, yayılan modaliteler ve diller. Amaç, insanların günümüzdeki gibi çok çeşitli aşağı akış yapay zeka görevlerini desteklemek için gösterimleri birlikte öğrenebilen önceden eğitilmiş modellere sahip olmaktır. Son beş yıl içinde konuşma tanıma, makine çevirisi, konuşma sorusu yanıtlama, makine okuma kavrama ve görüntü başlık etme ölçütlerinde insan performansı elde ettik. Bu beş atılım, insanların öğrenme ve anlama şekline daha yakın olan çok algılayıcılı ve çok dilli öğrenmeyi başararak yapay zeka özelliklerinde bir sıçrama elde etmek için daha iddialı hedeflerimize yönelik güçlü sinyaller sağladı. Ortak XYZ-code'un, aşağı akış yapay zeka görevlerinde dış bilgi kaynaklarıyla temellenmişse, bu isteğin temel bir bileşeni olduğuna inanıyorum."

Belge özetleme API isteği, isteğin alınması üzerine API arka ucu için bir iş oluşturularak işlenir. İş başarılı olursa API'nin çıkışı döndürülür. Çıkış 24 saat boyunca alınabilir. Bu süreden sonra çıkış temizlenir. Çok dilli ve emoji desteği nedeniyle yanıtta metin uzaklıkları olabilir. Daha fazla bilgi için bkz . uzaklıkları işleme.

Yukarıdaki örneği kullandığınızda, API aşağıdaki özetlenmiş cümleleri döndürebilir:

Ayıklayıcı özetleme:

  • "Microsoft olarak, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimseyerek yapay zekayı mevcut tekniklerin ötesine geçirme arayışındayız."
  • "XYZ-code'un uzun vadeli vizyonumuzu yerine getirmemize olanak sağladığına inanıyoruz: etki alanları arası aktarım öğrenmesi, yayılan modaliteler ve diller."
  • "Amaç, insanların bugün yaptığı gibi çok çeşitli aşağı akış yapay zeka görevlerini desteklemek için gösterimleri birlikte öğrenebilen önceden eğitilmiş modellere sahip olmaktır."

Soyut özetleme:

  • "Microsoft, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimser. XYZ-code'un uzun vadeli vizyonumuzu yerine getirmemize olanak sağladığına inanıyoruz: etki alanları arası aktarım öğrenmesi, yayılan modaliteler ve diller. Son beş yıl içinde, karşılaştırmalar üzerinde insan performansı elde ettik."

Belge ayıklayıcı özetlemeyi deneyin

Makalelerin, makalelerin veya belgelerin özetlerini almak için belge ayıklayıcı özetlemeyi kullanabilirsiniz. Bir örneği görmek için hızlı başlangıç makalesine bakın.

Parametresini sentenceCount kullanarak, varsayılan değer olarak 3 kaç cümle döndürülür kılavuzluk edebilirsiniz. Aralık 1 ile 20 arasındadır.

Ayıklanan tümcelerin hangi sırada döndürüleceğini belirtmek için parametresini sortby de kullanabilirsiniz( Offset veya Rankvarsayılan değer olarak Offset ).

parametre değeri Açıklama
Derece Tümceleri, hizmet tarafından karar verilen giriş belgesiyle ilgilerine göre sıralar.
Atlanacak sayı Giriş belgesinde tümcelerin görüntülendiği özgün sırayı korur.

Belge soyut özetlemeyi deneyin

Aşağıdaki örnek, belge soyutlama özetlemesi ile çalışmaya başlamanızı sağlar:

  1. Aşağıdaki komutu bir metin düzenleyicisine kopyalayın. BASH örneği satır devamlılığı karakterini kullanır \ . Konsolunuz veya terminaliniz farklı bir satır devamlılığı karakteri kullanıyorsa, bunun yerine bu karakteri kullanın.
curl -i -X POST https://<your-language-resource-endpoint>/language/analyze-text/jobs?api-version=2022-10-01-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>" \
-d \
' 
{
  "displayName": "Document Abstractive Summarization Task Example",
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "en",
        "text": "At Microsoft, we have been on a quest to advance AI beyond existing techniques, by taking a more holistic, human-centric approach to learning and understanding. As Chief Technology Officer of Azure AI services, I have been working with a team of amazing scientists and engineers to turn this quest into a reality. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). At the intersection of all three, there’s magic—what we call XYZ-code as illustrated in Figure 1—a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We believe XYZ-code enables us to fulfill our long-term vision: cross-domain transfer learning, spanning modalities and languages. The goal is to have pretrained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. Over the past five years, we have achieved human performance on benchmarks in conversational speech recognition, machine translation, conversational question answering, machine reading comprehension, and image captioning. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."
      }
    ]
  },
  "tasks": [
    {
      "kind": "AbstractiveSummarization",
      "taskName": "Document Abstractive Summarization Task 1",
      "parameters": {
        "summaryLength": short
      }
    }
  ]
}
'

belirtmezseniz sentenceCount, özet uzunluğunu model belirler. sentenceCount 1 ile 20 arasında bir çıkış özetinin cümle sayısının yaklaşık değeri olduğunu unutmayın. Soyut özetleme için sentenceCount kullanılması önerilmez.

  1. Gerektiğinde komutta aşağıdaki değişiklikleri yapın:

    • değerini your-language-resource-key anahtarınız ile değiştirin.
    • İstek URL'sinin ilk bölümünü uç nokta URL'nizle your-language-resource-endpoint değiştirin.
  2. Bir komut istemi penceresi açın (örneğin: BASH).

  3. Metin düzenleyicisindeki komutu komut istemi penceresine yapıştırın ve ardından komutunu çalıştırın.

  4. operation-location Yanıt üst bilgisinden öğesini alın. Değer aşağıdaki URL'ye benzer:

https://<your-language-resource-endpoint>/language/analyze-text/jobs/12345678-1234-1234-1234-12345678?api-version=2022-10-01-preview
  1. İsteğin sonuçlarını almak için aşağıdaki cURL komutunu kullanın. değerini önceki operation-location yanıt üst bilgisinden aldığınız sayısal kimlik değeriyle değiştirdiğinizden <my-job-id> emin olun:
curl -X GET https://<your-language-resource-endpoint>/language/analyze-text/jobs/<my-job-id>?api-version=2022-10-01-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>"

Soyut belge özetleme örneği JSON yanıtı

{
    "jobId": "cd6418fe-db86-4350-aec1-f0d7c91442a6",
    "lastUpdateDateTime": "2022-09-08T16:45:14Z",
    "createdDateTime": "2022-09-08T16:44:53Z",
    "expirationDateTime": "2022-09-09T16:44:53Z",
    "status": "succeeded",
    "errors": [],
    "displayName": "Document Abstractive Summarization Task Example",
    "tasks": {
        "completed": 1,
        "failed": 0,
        "inProgress": 0,
        "total": 1,
        "items": [
            {
                "kind": "AbstractiveSummarizationLROResults",
                "taskName": "Document Abstractive Summarization Task 1",
                "lastUpdateDateTime": "2022-09-08T16:45:14.0717206Z",
                "status": "succeeded",
                "results": {
                    "documents": [
                        {
                            "summaries": [
                                {
                                    "text": "Microsoft is taking a more holistic, human-centric approach to AI. We've developed a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We've achieved human performance on benchmarks in conversational speech recognition, machine translation, ...... and image captions.",
                                    "contexts": [
                                        {
                                            "offset": 0,
                                            "length": 247
                                        }
                                    ]
                                }
                            ],
                            "id": "1"
                        }
                    ],
                    "errors": [],
                    "modelVersion": "latest"
                }
            }
        ]
    }
}
parametre Açıklama
-X POST <endpoint> API'ye erişmek için uç noktanızı belirtir.
-H Content-Type: application/json JSON verilerini göndermek için içerik türü.
-H "Ocp-Apim-Subscription-Key:<key> API'ye erişmek için anahtarı belirtir.
-d <documents> Göndermek istediğiniz belgeleri içeren JSON.

Aşağıdaki cURL komutları bir BASH kabuğundan yürütülür. Bu komutları kendi kaynak adınız, kaynak anahtarınız ve JSON değerlerinizle düzenleyin.

Sorgu tabanlı özetleme

Sorgu tabanlı belge özetleme API'si, var olan belge özetleme API'sinin bir uzantısıdır.

En büyük fark istek gövdesindeki (altında)>querytasksparameters> yeni query bir alandır. Buna ek olarak, kısa/orta/uzun "demetlerinde" tercih edileni summaryLength belirtmenin yeni bir yolu vardır. Özellikle soyutlama kullanılırken yerine sentenceCountkullanılmasını öneririz. Aşağıda örnek bir istek verilmiştir:

curl -i -X POST https://<your-language-resource-endpoint>/language/analyze-text/jobs?api-version=2023-11-15-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>" \
-d \
' 
{
  "displayName": "Document Extractive Summarization Task Example",
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "en",
        "text": "At Microsoft, we have been on a quest to advance AI beyond existing techniques, by taking a more holistic, human-centric approach to learning and understanding. As Chief Technology Officer of Azure AI services, I have been working with a team of amazing scientists and engineers to turn this quest into a reality. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). At the intersection of all three, there’s magic—what we call XYZ-code as illustrated in Figure 1—a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We believe XYZ-code enables us to fulfill our long-term vision: cross-domain transfer learning, spanning modalities and languages. The goal is to have pretrained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. Over the past five years, we have achieved human performance on benchmarks in conversational speech recognition, machine translation, conversational question answering, machine reading comprehension, and image captioning. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."
      }
    ]
  },
  "tasks": [
    {
      "kind": "ExtractiveSummarization",
      "taskName": "Document Extractive Summarization Task 1",
      "parameters": {
        "query": "XYZ-code",
        "summaryLength": short
      }
    }
  ]
}
'

summaryParameter kullanma

parametresi için summaryLength üç değer kabul edilir:

  • short: Yaklaşık 120 belirteçle çoğunlukla 2-3 cümlenin özetini oluşturur.
  • medium: Yaklaşık 170 belirteçle çoğunlukla 4-6 cümlenin özetini oluşturur.
  • long: Yaklaşık 210 belirteçle çoğunlukla 7'den fazla cümlenin özetini oluşturur.

Hizmet ve veri sınırları

Dakika ve saniye başına gönderebileceğiniz isteklerin boyutu ve sayısı hakkında bilgi için hizmet sınırları makalesine bakın.

Ayrıca bkz.