FEAT: GPTFuzzer Orchestrator #226

gseetha04 · 2024-05-29T20:21:11Z

Description

Adding a new Orchestrator based on GPTFuzzer paper which uses MCTS algorithm to select a jailbreak template, apply prompt converter and send it to the target to get a response.

Implemented the MCTS algorithm for the seed selection

gseetha04 · 2024-05-29T21:33:24Z

@microsoft-github-policy-service agree company="Centific"

pyrit/orchestrator/GPTFuzz_orchestrator.py

pyrit/orchestrator/fuzzer_orchestrator.py

pyrit/datasets/score/content_classifiers/harmful_content.yaml

pyrit/datasets/score/content_classifiers/rule_match.yaml

pyrit/exceptions/exception_classes.py

pyrit/orchestrator/fuzzer_orchestrator.py

romanlutz · 2024-06-27T13:31:31Z

pyrit/orchestrator/fuzzer_orchestrator.py

+                scored_response.append(
+                    self._scorer.score_async(response))
+
+            batch_scored_response = await asyncio.gather(*scored_response)


This could be a lot. Maybe a batch size would help. With more than a few you'll just overwhelm the scoring target leading to failures. For batching we usually use a method on the normalizer, but the scorer doesn't have that yet if I remember correctly. Perhaps the batching logic itself should move to the scorer to have that batch method available and you can just call it from here and not worry about batching in an orchestrator. Cc @rlundeen2

Note that #331 is adding batch scoring which we can use here! Hooray!

Let's just leave this comment open until #331 is merged.

pyrit/orchestrator/fuzzer_orchestrator.py

pyrit/exceptions/exception_classes.py

pyrit/orchestrator/fuzzer_orchestrator.py

romanlutz

Mostly tiny things but wanted to be thorough since we're getting close.

pyrit/orchestrator/fuzzer_orchestrator.py

tests/orchestrator/test_fuzzer_orchestrator.py

pyrit/orchestrator/fuzzer_orchestrator.py

tests/orchestrator/test_fuzzer_orchestrator.py

romanlutz · 2024-09-04T17:30:48Z

tests/orchestrator/test_fuzzer_orchestrator.py

+        with patch.object(fuzzer_orchestrator, '_select' ) as mock_get_seed:
+            mock_get_seed.return_value = prompt_node # return a promptnode 
+        with patch.object(fuzzer_orchestrator,'_apply_template_converter') as mock_apply_template_converter:
+            mock_apply_template_converter.return_value = prompt_node  #return_value
+        with patch.object(fuzzer_orchestrator,'_update') as mock_update:
+            fuzzer_orchestrator._prompt_normalizer = AsyncMock()
+            fuzzer_orchestrator._prompt_normalizer.send_prompt_batch_to_target_async = AsyncMock(return_value=prompt_target_response) #return_value
+            fuzzer_orchestrator._scorer = AsyncMock()
+
+            fuzzer_orchestrator._scorer.score_async = AsyncMock(  # type: ignore
+            side_effect =[[false_score] * (rounds-1) * len(simple_prompts.prompts) + [true_score] * len(simple_prompts.prompts) ] #score2, score2,score2, score2,score1
+            )


Something is off here.
As soon as you're outside the with-block the context is gone, so these mock objects are gone.
They should be nested I think (?)

Plus, you're defining a side_effect in the last lines and not using it. Where are we actually calling execute_fuzzer?

tests/orchestrator/test_fuzzer_orchestrator.py

pyrit/orchestrator/fuzzer_orchestrator.py

tests/exceptions/test_exceptions.py

pyrit/orchestrator/fuzzer_orchestrator.py

pyrit/exceptions/__init__.py

pyrit/exceptions/exception_classes.py

tests/exceptions/test_exceptions.py

romanlutz reviewed May 29, 2024

View reviewed changes

romanlutz reviewed Jun 4, 2024

View reviewed changes

romanlutz reviewed Jun 6, 2024

View reviewed changes

romanlutz reviewed Jun 12, 2024

View reviewed changes

jl8771 mentioned this pull request Jun 17, 2024

FEAT: Add shorten/expand converters #246

Merged

romanlutz reviewed Jun 18, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Jun 27, 2024

View reviewed changes

romanlutz reviewed Jul 2, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz linked an issue Jul 23, 2024 that may be closed by this pull request

FEAT add fuzzer orchestrator #110

Closed

romanlutz reviewed Aug 5, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Aug 5, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Aug 5, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Aug 5, 2024

View reviewed changes

pyrit/exceptions/exception_classes.py Outdated Show resolved Hide resolved

romanlutz reviewed Aug 5, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Aug 5, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Aug 5, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Aug 29, 2024

View reviewed changes

romanlutz reviewed Aug 30, 2024

View reviewed changes

romanlutz changed the title ~~[DRAFT] FEAT: GPTFuzzer Orchestrator~~ FEAT: GPTFuzzer Orchestrator Aug 30, 2024

romanlutz marked this pull request as ready for review August 30, 2024 18:45

romanlutz reviewed Sep 3, 2024

View reviewed changes

tests/orchestrator/test_fuzzer_orchestrator.py Outdated Show resolved Hide resolved

tests/orchestrator/test_fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 3, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

tests/orchestrator/test_fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

tests/orchestrator/test_fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

tests/orchestrator/test_fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

tests/orchestrator/test_fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

tests/orchestrator/test_fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

tests/orchestrator/test_fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 4, 2024

View reviewed changes

tests/orchestrator/test_fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

tests/exceptions/test_exceptions.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

pyrit/orchestrator/fuzzer_orchestrator.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

pyrit/exceptions/__init__.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

pyrit/exceptions/exception_classes.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

pyrit/exceptions/exception_classes.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

pyrit/exceptions/exception_classes.py Outdated Show resolved Hide resolved

romanlutz reviewed Sep 6, 2024

View reviewed changes

tests/exceptions/test_exceptions.py Outdated Show resolved Hide resolved

romanlutz closed this Sep 7, 2024

romanlutz mentioned this pull request Sep 10, 2024

FEAT: Fuzzer orchestrator #360

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FEAT: GPTFuzzer Orchestrator #226

FEAT: GPTFuzzer Orchestrator #226

gseetha04 commented May 29, 2024

gseetha04 commented May 29, 2024 •

edited

Loading

romanlutz Jun 27, 2024

romanlutz Aug 29, 2024

romanlutz left a comment

romanlutz Sep 4, 2024

FEAT: GPTFuzzer Orchestrator #226

FEAT: GPTFuzzer Orchestrator #226

Conversation

gseetha04 commented May 29, 2024

Description

gseetha04 commented May 29, 2024 • edited Loading

romanlutz Jun 27, 2024

Choose a reason for hiding this comment

romanlutz Aug 29, 2024

Choose a reason for hiding this comment

romanlutz left a comment

Choose a reason for hiding this comment

romanlutz Sep 4, 2024

Choose a reason for hiding this comment

gseetha04 commented May 29, 2024 •

edited

Loading